然而,我們距離那個無法挽回的臨界點究竟還有多遠?
翻譯,簡而言之,即是“將文字轉(zhuǎn)換成另一種語言”。然而,任何有過多種語言經(jīng)驗的人都會深知字面直譯的潛在陷阱。盡管像谷歌翻譯這樣的應用為我們提供了快速便捷的翻譯服務,但它們在語境理解、多義詞匯、成語表達、地域性用語、性別差異,以及實際技術(shù)障礙等方面仍顯得捉襟見肘。
我們多數(shù)人都曾聽聞過那些幽默或是嚴重的誤譯事例,這些誤譯往往暴露了對所謂“低價值”語言的不尊重。在我首次擔任威爾士語/英語雙語詩歌選集的合作編輯與翻譯時,便曾親歷這樣的窘境。非威爾士語使用者通過谷歌翻譯嘗試理解希安·諾西的詩作《Rhyw Bedair Awr》的主題,其正確含義應為“大約四個小時”,但“rhyw”一詞含義頗豐。結(jié)果,詩作的標題被譯作“四個小時的性愛”——這一誤譯雖然為活動增添了不少談資,卻也凸顯了翻譯應用在語境把握上的巨大難題。
土著活動家羅賓·沃爾·金默爾曾將語言比作觀察世界的棱鏡,這一比喻令我深感共鳴。它讓我意識到,我們所體驗的語言越多樣,我們所能見到的色彩光譜也就越豐富。在我與資深翻譯家希安·諾西共同致力于雙語詩歌選集的編輯與翻譯過程中,這一理念始終貫穿在我的思考之中。
]]>問:你為什么喜歡閱讀《MultiLingual》雜志?
答:這本雜志以人為本,我特別喜歡這一點。同時,它還經(jīng)常探討少數(shù)民族語言和文化,這對于保護這些語言和文化至關(guān)重要。
問:你是如何進入翻譯行業(yè)的?
答:我在巴塞羅那自治大學學習了翻譯和口譯專業(yè)。雖然我一度猶豫是否要選擇這個專業(yè),但一旦下定決心,我就知道這是我想從事的行業(yè)。在大學期間,我有幸在格拉納達的SDL辦公室實習,通過電子郵件交付翻譯作品并接受反饋。實習期間,我接觸了多種多樣的主題,包括本地化、醫(yī)療設備、合同、營銷文本和視頻游戲等。這段短暫的實習經(jīng)歷讓我對翻譯行業(yè)有了全面的了解,也讓我更加熱愛這個行業(yè)。
問:自從你進入翻譯行業(yè)以來,商業(yè)環(huán)境發(fā)生了哪些變化?
答:最大的變化無疑是機器翻譯(MT)和人工智能(AI)的興起。雖然機器翻譯曾一度被廣泛嘗試,但效果并不理想。然而,當我2016年開始從事自由翻譯業(yè)務時,我發(fā)現(xiàn)機器翻譯的使用量有所下降,因為許多公司開始意識到人性化元素在翻譯中的重要性。如今,隨著技術(shù)的進步和人工智能的應用,翻譯行業(yè)似乎又掀起了一股自動化熱潮。但我認為,許多公司仍處于探索階段。
問:你能分享一下與第一個客戶合作或第一個項目的經(jīng)歷嗎?
答:當然可以。八年前,當我剛開始從事自由翻譯業(yè)務時,我的第一個客戶是我在馬拉加年輕企業(yè)家協(xié)會認識的一位女士。她所在的公司主要從事營銷工作。我們之前曾嘗試合作過幾次,但都未能實現(xiàn)。當她得知我開始從事自由職業(yè)時,便主動聯(lián)系了我,并提供了一個為當?shù)刭徫镏行姆g社交媒體內(nèi)容的工作機會。這個經(jīng)歷讓我意識到,無論公司規(guī)模大小,人們更傾向于與真實的人進行合作。
回想起來,即使那些年我建立的聯(lián)系并非都帶來了直接的業(yè)務機會,但我也給人們留下了深刻的印象。如今,我的一些早期客戶仍然與我保持著合作關(guān)系,而那些已經(jīng)轉(zhuǎn)職到其他公司的人也會再次聯(lián)系我。這讓我感到非常榮幸和自豪。
問:你認為現(xiàn)在是進入翻譯行業(yè)的好時機嗎?
答:說實話,這個問題很難回答,因為它取決于個人的情況和心態(tài)。有時我會覺得,除非只想從事機器翻譯后編輯(MTPE)項目,否則不建議人們輕易選擇翻譯行業(yè)。然而,另一方面,我也認為盡管人工智能取得了顯著進展,但翻譯人員的價值仍然不可替代。他們除了具備語言技能外,還能為公司提供許多其他有價值的服務。因此,我試圖保持這種積極的看法,以便在這個行業(yè)中更好地生存下去。
問:在未來10年里,你希望自己處于什么樣的職業(yè)位置?
答:雖然我希望自己能在未來10年內(nèi)退休,但現(xiàn)實是,到那時我還遠未達到西班牙的退休年齡。因此,我的B計劃是繼續(xù)與那些重視我作為翻譯和語言顧問工作的客戶合作。這些客戶能夠正確地將技術(shù)視為一種工具,而不是降低費率的借口(對于我所從事的語言對來說,費率已經(jīng)持續(xù)低迷了10多年)。
我喜歡向客戶提供有關(guān)技術(shù)和流程方面的咨詢建議,因為許多公司在翻譯領(lǐng)域仍然是新手。他們可能沒有專門的翻譯部門,甚至不了解我們使用的翻譯工具。因此,我希望能夠與他們合作,借助語言和文化的力量幫助他們成功開拓新市場。
問:你對翻譯行業(yè)的未來有何預測?
答:我認為,未來翻譯人員將更多地涉足戰(zhàn)略方面的工作,而不僅僅是語言層面的處理(盡管我不太喜歡這種趨勢,但我們無法逆轉(zhuǎn)行業(yè)的進步)。同時,我也認為翻譯將逐漸成為更大項目的一個組成部分。目前,翻譯通常被視為一項孤立且反應性的任務,但我相信未來公司會在產(chǎn)品或營銷活動開發(fā)的早期階段就更多地考慮翻譯的需求。
此外,雖然我可能有些天真,但我依然認為這個世界充滿了無限的商機:無論是那些追求從報價到項目管理和交付全流程自動化的人,還是那些依然珍視與真人合作、希望在項目遇到問題時能及時聯(lián)系到人的客戶,都將在這個行業(yè)中找到屬于自己的位置。
]]>巴別魚——經(jīng)典科幻小說《銀河系漫游指南》中設想的翻譯動物——的夢想可能更接近現(xiàn)實??萍季揞^ Meta 的研究人員創(chuàng)建了一個機器學習系統(tǒng),可以幾乎立即將 101 種語言的語音翻譯成語音合成器以 36 種目標語言中的任意一種說出的單詞。
大規(guī)模多語言和多模式機器翻譯 (SEAMLESSM4T) 系統(tǒng)還可以將語音翻譯為文本、文本翻譯為語音以及文本翻譯為文本。該結(jié)果于 1 月 1 日發(fā)表在《自然》雜志上。
Meta 總部位于加利福尼亞州門洛帕克,運營 Facebook、WhatsApp 和 Instagram 等社交媒體網(wǎng)站。Meta 表示,在成功發(fā)布 SEAMLESSM4T 的成功發(fā)布后,它正在將 SEAMLESSM4T 開源給其他想要在其基礎上進行開發(fā)的研究人員。 LLaMA面向全球開發(fā)人員的大型語言模型。
機器翻譯在過去幾十年中取得了巨大進步,這在很大程度上要歸功于在大型數(shù)據(jù)集上訓練的神經(jīng)網(wǎng)絡的引入。主要語言(尤其是英語)的訓練數(shù)據(jù)比比皆是,但許多其他語言的訓練數(shù)據(jù)卻非常稀缺。這種不平等限制了機器可以訓練翻譯的語言范圍。 “這會影響互聯(lián)網(wǎng)上不常出現(xiàn)的任何語言,”紐約州伊薩卡康奈爾大學的計算機科學家艾莉森·科內(nèi)克 (Allison Koenecke) 在該論文隨附的《新聞與觀點》文章中寫道。機器人作家:語言生成人工智能的興起和風險
Meta 團隊以之前的語音到語音翻譯2以及名為No Language Left Behind?3的項目為基礎,該項目旨在為大約 200 種語言提供文本到文本翻譯。根據(jù)經(jīng)驗,Meta 和其他地方的研究人員發(fā)現(xiàn),即使在訓練數(shù)據(jù)有限的翻譯語言中,使翻譯系統(tǒng)成為多語言也可以提高其性能;為什么會發(fā)生這種情況尚不清楚。
該團隊從互聯(lián)網(wǎng)和聯(lián)合國檔案等其他來源收集了數(shù)百萬小時的演講音頻文件,以及人工生成的演講翻譯。作者還收集了其中一些演講的文字記錄。
該團隊還使用可靠的數(shù)據(jù)來訓練模型以識別兩個匹配的內(nèi)容。這使得研究人員能夠?qū)⒋蠹s 50 萬小時的音頻與文本配對,并自動將一種語言的每個片段與其他語言的對應片段進行匹配。
]]>翻譯機(基于硬件并使用包括基于軟件的機器翻譯在內(nèi)的技術(shù)),例如最近公布的“翻譯站”,可能具有多種用途,從將課堂內(nèi)容翻譯成新來的非語言學習者的母語。 – 英語學生為英語水平有限或沒有英語水平的家庭提供翻譯材料。然而,雖然技術(shù)可以提供快速的解決方案,但它們不一定是有效的。必須仔細考慮與這些工具相關(guān)的潛在意外后果:
為克服教育中的語言障礙所做的努力值得贊揚。然而,ATA、AAITE 和 NAETISL 主張在學校中采取平衡的語言獲取和服務方法,將技術(shù)作為一種工具而不是一種超賣的解決方案進行整合。通過發(fā)送未經(jīng)專業(yè)語言學家審查的外語材料,學校還可能面臨對其無意發(fā)送的信息承擔責任的風險。
]]>羅馬——2024年11月4日
今天,我們舉辦了一場獨特的活動,探索語言的力量以及我們在通用翻譯器方面取得的進展。我們推出了世界上最好的翻譯人工智能Lara,以及支持翻譯人員、內(nèi)容創(chuàng)作者和公司本地化需求的新工具。
介紹Lara
我們的首席執(zhí)行官Marco Trombetti介紹了Lara,這是15年多來機器翻譯研究的結(jié)晶。2011年,我們率先推出了自適應機器翻譯。自2017年以來,我們一直在使用Transformer模型為我們的神經(jīng)機器翻譯系統(tǒng)提供動力,該模型是為翻譯而發(fā)明的,后來成為生成式人工智能的基礎。在ChatGPT發(fā)布后,大型語言模型開始流行起來,許多人對它們的流暢性和處理大型上下文的能力感到驚訝,但也對它們?nèi)狈蚀_性感到沮喪。我們已經(jīng)孜孜不倦地將大型語言模型的強大功能與機器翻譯的準確性相結(jié)合。今天,我們很自豪地達到了這一里程碑,將兩者與世界上最好的翻譯人工智能Lara相結(jié)合。
Lara通過解釋其選擇、利用上下文理解和推理來提供用戶可信賴的專業(yè)級翻譯,從而重新定義了機器翻譯。它是在全球可用的最大、最精選的真實世界翻譯數(shù)據(jù)集上進行訓練的。得益于我們與NVIDIA的長期合作,Lara在NVIDIA AI平臺上使用了120萬個GPU小時進行訓練。
翻譯9個結(jié)果照片
借助Lara,企業(yè)可以解決以前難以想象的本地化項目。翻譯人員和多語言創(chuàng)作者將在他們的日常工作中享受Lara帶來的便利,從而提高生產(chǎn)力和準確性。
Lara的錯誤率僅為每千詞2.4個。2025年,我們的目標更高——計劃利用2000萬個GPU小時來進一步實現(xiàn)語言奇異性。
]]>自OpenAI的ChatGPT于2022年11月橫空出世以來,企業(yè)高層要求在業(yè)務流程中采用人工智能的壓力已經(jīng)變得眾所周知,且越來越普遍。
近兩年后,很明顯,語言翻譯行業(yè)也注意到了來自高端客戶的好奇。
根據(jù)Slator發(fā)布的2024年語言公司協(xié)會(ALC)行業(yè)調(diào)查報告,2024年1月至7月,76%的語言服務提供商(LSPs)收到了客戶關(guān)于人工智能翻譯或口譯的主動咨詢。
當然,對人工智能的興趣并不局限于語言服務客戶;許多語言服務提供商長期以來一直在探索是否以及如何將人工智能集成到他們的工作流程中。
這反映在受訪者將“人工智能和大數(shù)據(jù)”選為未來三年他們希望員工具備的第一技能。
126名受訪者從行業(yè)中員工現(xiàn)在需要的頂級技能中選擇了一到三項?!叭斯ぶ悄芎痛髷?shù)據(jù)”被40%的受訪者提及,是被引用最多的答案,從2023年的第二位上升。
2024年,“創(chuàng)造性思維”這一榮譽由28%的公司認定為必備技能?!胺諏蚝涂蛻舴铡本o隨其后;在2023年高居榜首之后,2024年有26%的受訪者列出了這一點。
]]>歐洲人事選拔辦公室(EPSO)宣布了一系列歐盟(EU)八種語言翻譯職位的招聘比賽,這八種語言分別是:丹麥語、荷蘭語、英語、法語、希臘語、意大利語、馬耳他語和西班牙語。
招聘廣告中提到該職位“無需專業(yè)經(jīng)驗”,工作內(nèi)容包括將至少兩種源語言翻譯成目標語言、更新譯文、編輯、執(zhí)行質(zhì)量保證、研究術(shù)語以及為培訓活動和IT工具的開發(fā)做出貢獻。
原文材料通常涉及與歐盟業(yè)務相關(guān)的復雜文本,涵蓋政治、法律、經(jīng)濟、金融、科學和技術(shù)等領(lǐng)域。翻譯人員還需使用專業(yè)工具翻譯傳播材料和字幕。
申請條件及方式
申請人必須是歐盟成員國的公民,擁有大學學位,或者至少完成了三年的大學學習,并在2025年4月10日之前獲得畢業(yè)證書。
申請人還應具備優(yōu)秀的語言能力,包括掌握24種歐盟官方語言中的至少三種。這三種語言包括翻譯人員的母語和另外兩種語言。
申請時間從2024年12月3日開始,至2025年1月14日布魯塞爾時間中午截止。更多信息可在招聘廣告和視頻中找到。申請必須通過EPSO網(wǎng)站在線提交。
]]>除了官方意大利語之外,教皇的反思和對圣經(jīng)文本的講解還將以7種語言進行。
“下周的聽眾活動將開始提供中文翻譯,”教皇方濟各在2024年11月27日的周度聽眾活動中宣布這一消息時,臉上洋溢著喜悅。因此,首次中文翻譯將于12月4日進行,即禮拜年的開始和降臨節(jié)的首個周日。
每周三,教皇都會在向公眾開放的周度聽眾活動中講解圣經(jīng)文本。聽眾活動通常在圣彼得廣場或梵蒂岡內(nèi)的保羅六世大廳舉行。
在他發(fā)言之前,會先用多種語言朗讀一段簡短的圣經(jīng)摘錄。在他的講道結(jié)束后,還會翻譯他演講的摘要以及他用特定語言向信徒傳達的信息的翻譯。
這些翻譯由梵蒂岡員工負責,目前除了官方意大利語之外,還提供法語、英語、德語、西班牙語、葡萄牙語、波蘭語和阿拉伯語六種語言的翻譯。
阿拉伯語是最近一種被永久添加的語言,由本篤十六世于2012年10月10日加入。
有時,為了應對特殊場合,例如到場的一群朝圣者使用另一種語言時,也會添加相應的語言翻譯,例如最近就聽到過烏克蘭語和斯洛伐克語的翻譯。
]]>過去的和現(xiàn)在的機器翻譯方法
隨著時間的推移,機器翻譯的方法不斷演變,包括:
當前許多最先進的翻譯應用都基于神經(jīng)機器翻譯,這是對傳統(tǒng)基于統(tǒng)計機器翻譯方法的改進。神經(jīng)機器翻譯使用更多維度來表示源文本和目標文本的標記(如單詞、詞素和標點符號)。
機器翻譯的未來:生成式人工智能
現(xiàn)在,一種新的機器翻譯方法已經(jīng)扎根:生成式人工智能(GenAI)。生成式人工智能依賴于大型語言模型(LLM),這是一種深度學習的人工智能模型,可消費和訓練大規(guī)模數(shù)據(jù)集,從而在語言處理任務(如翻譯)中表現(xiàn)出色。在這些模型完成學習過程后,它們會在受到提示時生成統(tǒng)計上可能的輸出。這些模型會根據(jù)其訓練數(shù)據(jù)創(chuàng)建模仿自然語言的新文本組合。
大型語言模型的發(fā)展是一個漸進的過程。最早的大型語言模型相對較小,只能執(zhí)行簡單的語言任務。然而,隨著深度神經(jīng)網(wǎng)絡的發(fā)展,更大、更強大的大型語言模型被創(chuàng)建出來。2020年發(fā)布的生成式預訓練Transformer 3(GPT-3)模型標志著大型語言模型發(fā)展的一個重要里程碑。GPT-3展示了生成連貫且聽起來自然的文本的能力。GPT-3及其后續(xù)模型已經(jīng)在多種語言的數(shù)據(jù)集上進行了訓練,因此可以生成這些語言的輸出。
神經(jīng)機器翻譯與大型語言模型
大型語言模型有可能在成本、速度和翻譯質(zhì)量方面超越神經(jīng)機器翻譯,同時支持多語言應用程序中自然語言處理功能的開發(fā)。然而,神經(jīng)機器翻譯和大型語言模型各有優(yōu)缺點。對于某些翻譯任務,神經(jīng)機器翻譯將是最合適的技術(shù);而對于其他任務,大型語言模型將更有意義。
神經(jīng)機器翻譯與大型語言模型之間存在相似之處:
然而,也存在重要差異:
對語言行業(yè)的影響
與機器翻譯的早期演變一樣,生成式人工智能使翻譯過程比純粹的人工翻譯更快、更便宜。然而,與之前的演變不同的是,生成式人工智能還可以改變翻譯過程的其他方面,如源文審查、術(shù)語提取、上下文提取以及翻譯質(zhì)量評估。
盡管大型語言模型并非專門針對翻譯進行訓練,但它們在自然語言任務中的廣泛應用意味著它們在翻譯任務上表現(xiàn)出色,尤其是對于訓練了大量數(shù)據(jù)集的語言而言。大型語言模型可以生成聽起來自然的源文本翻譯,甚至在目標文本中使用地道的表達。這些特質(zhì)使大型語言模型有望成為未來幾年翻譯領(lǐng)域的變革性技術(shù)。
]]>本次盛會的主題為“攜手塑造翻譯未來”,我們將聚焦于如何通過合作與技術(shù)應對語言翻譯行業(yè)面臨的現(xiàn)代挑戰(zhàn)。面對技術(shù)的日新月異,我們希望在“2025攜手盛會”中深入探討如何完美融合人類智慧與AI驅(qū)動工具,從而在變革中尋求更加繁榮的發(fā)展。
本次盛會精心策劃了兩個板塊:
板塊A——新篇章啟幕。我們將一同揭開語言行業(yè)新篇章的序幕,展望未來的發(fā)展趨勢與機遇。
板塊B——細節(jié)決定成敗。我們將深入探討行業(yè)中的各個細則,以確保在追求發(fā)展的道路上不遺漏任何關(guān)鍵環(huán)節(jié)。
此外,今年我們還新增了研討會環(huán)節(jié),旨在為與會者提供實用的見解與工具。內(nèi)容將涵蓋從財務規(guī)劃到利用AI促進業(yè)務發(fā)展等多個方面,助力您在語言翻譯行業(yè)中取得更大的成功。
同時,我們還將舉辦一場專為語言專業(yè)人才和語言服務公司打造的招聘會。這將是一個絕佳的機會,讓自由譯者接觸到正在尋找專業(yè)服務的潛在客戶,而語言服務提供商和供應商經(jīng)理則可以借此機會建立起一個可信賴的合作伙伴網(wǎng)絡。
]]>