前言:尋找寫作靈感?中文期刊網用心挑選的學生機器翻譯實踐報告,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
摘要:人工智能的迅猛發展帶動了機器翻譯的普及和興盛。各種免費的在線翻譯網站投入使用,為語言學習者特別是學生譯者帶來了便捷。本研究根據翻譯專業二年級學生譯者提交的機器翻譯實踐報告,分析以谷歌翻譯為代表的國內外六大免費在線翻譯網站在處理和生成非文學翻譯文本方便取得的進步以及存在的局限。本研究論證在學生譯者工具子能力培養方面,翻譯教學可以有效地引導學生譯者合理使用機器翻譯以實現人機翻譯的目的。
關鍵詞:機器翻譯;在線翻譯網站;工具子能力培養;學生譯者
1人工智能時代的機器翻譯
機器翻譯自1946年開始產生,經歷了五個時期,即萌芽期、創立期、冷凍期、興盛期復興期和興盛期。學者們普遍認同從90年代開始,機器翻譯從基于規則的方法向基于語料庫的方法發展?;谡Z料庫的方法包含實例和統計兩種形式,后者更趨主導。機器翻譯研發團隊將基于統計的方法作為核心規則。2006年谷歌公司推出的谷歌翻譯(GoogleTranslate)在線翻譯網站,其免費的翻譯服務為眾多用戶帶來便捷。谷歌翻譯網站的運行標志著數據驅動的統計機器翻譯活動成為商務機器翻譯系統的主流(趙應吉,2019:113)。2016年以來,谷歌翻譯的新一代端對端神經翻譯系統研究技術突飛猛進發展,成為行業標桿,其翻譯的準確性和高效性遠遠超過統計機器翻譯。國內的幾大商用在線機器翻譯網站緊跟時代潮流,以神經機器翻譯為核心技術,研發出符合中國人使用習慣的在線翻譯網站,提供便捷的機器翻譯服務。國內較為知名并在業界占領重要地位的機器翻譯網站如百度翻譯、搜狗翻譯、360翻譯和有道翻譯等。國際上除了谷歌翻譯占據顯著的地位,微軟研發的必應翻譯也獲得較好的口碑。
2機器翻譯與學生譯者工具子能力培養的關聯研究
國際上針對工具子能力培養研究較為突出的是西班牙PACTE研究小組的翻譯能力培養理論和奧地利學者提出的“翻譯能力發展”(TransComp)項目。PACTE小組有關于工具子能力的定義是如何使用一些翻譯資源更好地為翻譯服務的能力,包括查詢詞典和使用網絡搜索引擎等能力。TransComp項目總結為工具和研究能力,類似前者的工具子能力,是譯者使用紙質和電子參考工具的能力,但也注重譯者的研究能力的提升。(朱玉彬,2015:34)馬會娟(2013)提到翻譯能力培養中,工具能力培養特別是譯者工具查詢能力的培養尤為重要,針對職業譯者而言,學生譯者是區別于職業譯者的一類特殊人群,未來計劃從事具體的翻譯工作,比如口筆譯方向,活躍在文學或是非文學翻譯領域的翻譯。對于高校中翻譯專業、英語專業翻譯方向和翻譯碩士等群體都是學生譯者的培養群體??v觀機器翻譯的發展,機器翻譯分為全自動機器翻譯、機助人譯或計算機輔助翻譯(ComputerAidedTranslation)、人助機譯三類。就國內本科階段和研究生階段,學生譯者培養過程中,翻譯能力培養的子策略之一——工具子能力的培養來看,國內大多數的院校開設了計算機輔助翻譯課程,簡稱CAT。學者對于機器翻譯和翻譯教學的研究多聚焦在CAT領域。所以機器翻譯在進入第五個翻譯階段即興盛期時,仍無法脫離人工翻譯的審核和糾正,完全實現自動化,并將人工翻譯取而代之。人工智能時代的到來,機器翻譯的發展越發成熟,作為學生譯者,特別是未來有志于從事翻譯職業化工作的學生來說,學習必要的機輔技術、翻譯工具,學會使用在線翻譯網站和相關翻譯軟件,尤為重要。
3翻譯專業學生機器翻譯體驗報告的生成及分析
本研究以某高校翻譯專業二年級兩個班級共57位同學提交的機器翻譯實踐報告為材料,匯總、分析學生譯者體驗國內外六大在線翻譯網站的評價。學生譯者根據不同翻譯網站生成的譯本,并結合自己對語篇的理解和翻譯,探討在人工智能高速發展的今天,機器翻譯特別是免費的在線翻譯網站免費在譯文生成的時效、譯文質量以及譯文存在的不足等重要問題方面展開討論。根據紐馬克對文本類型的劃分,非文學作品屬于信息型文本(informativetext)主要用于傳遞信息或者客觀描述事實,采取直接的表達方式而不通過具體描寫形容的方法來呈現風格問題,但往往有其固定表達方式,一般較少涉及審美的活動。本次提交的學生譯者機器翻譯實踐報告均選用非文學文本,可以是科技翻譯、新聞翻譯、法律翻譯、旅游翻譯和政宣翻譯等文本材料,不少于300字以英譯漢作為實踐形式。學生譯者可以使用由教師推薦的國內外六大在線翻譯網站,即谷歌翻譯、微軟必應翻譯、百度翻譯、搜狗翻譯、360翻譯、網易有道翻譯。均是國內外知名的、免費的在線翻譯網站。73%的同學選擇科技類文本進行機器翻譯實踐。翻譯科技類文章,需要先了解科技文體的類型和受眾群體??萍嘉捏w包括科技專著、科學論文、科普讀物等,涉及自然科學、生物、物理技術等專業題材。其中,以科學論文和科普讀物來說,科學論文要求專業、嚴謹和精確、科普讀物的主要目的在于向大眾讀者傳遞有效的科學信息,譯者以普及科學知識為目的,語言表達上盡可能化繁為簡,但又不能任意刪減,使信息缺失。一定要做到邏輯上嚴密,語言表述上精準。本次機器翻譯實踐報告共57位學生譯者參與體驗,男女生比例為9:48。教師建議學生譯者在實踐報告中加上自己的翻譯部分,加深對原作的理解,對照機器翻譯的幾個譯本。自我完成作品的時候可以使用相應的翻譯工具,比如英漢詞典。對于當代的語言學習者,對于紙質工具書的使用率呈下降趨勢,過分依賴網絡在線查詞或APP查詞軟件。紙質工具書查閱能力、在線查詞能力和APP詞典使用能力等都是工具子能力培養的范疇。有些學生譯者只是簡單尋求詞義,而非將詞匯、短語等表達帶入具體的語境中,進而研究詞或短語的具體含義。在網絡連接時,一些較好的在線詞典或者是查詞軟件還是具有強大的詞庫功能,提供的例句釋義非常適合翻譯專業學生學習,掌握具體的詞匯或是短語在句型中的表達含義。
4學生譯者工具子能力培養和機器翻譯使用反饋
基于統計的機器翻譯以短語為翻譯的基本單位,神經為基礎的機器翻譯則以句子為翻譯的基本單位,大大提高了翻譯的準確度,對于句子翻譯的整體把握比之前的機器翻譯躍升了一個新臺階。有研究表明,當句子中單詞超過40詞時,長句翻譯情況不容樂觀。主要原因之一在于翻譯模型在解碼時,搜索算法更傾向于選擇短句生成最終翻譯。句子為翻譯單位有其局限性,盡管當代翻譯學理論普遍認可句子作為翻譯活動的基本單位,但不少翻譯家提出了應當以語篇為翻譯的基本單位,保證上下文理解的合理性、完整性、準確性和流暢性。目前的機器翻譯技術達不到以語篇翻譯為基本單位的標準。在學生譯者提交的機器翻譯實踐報告中,85%的學生提到機器翻譯在長句翻譯方面問題將較為嚴重,主要體現在句型語義理解錯誤、語法結構失誤等。從提交的57份機器翻譯實踐報告中得到評價,就機器翻譯而言,反饋最好的幾點內容如下:1)在線翻譯網站最便捷之處在于詞匯方面的完成情況,特別針對專業術語、專有名詞的處理非常迅速。2)機器翻譯因其強大的數據庫和語料庫等檢索功能為支撐,能較好地完成翻譯的初稿。3)機器翻譯速度非常快,從文本復制進入對話框,到文本生成基本1-2秒瞬間完成。這是人工翻譯無法比擬的。4)就非文學翻譯文本完成情況來看,總體正確率在70—80%左右。讀者滿意度較高。5)專有名詞的處理,大多數完成情況較好,省時省力。從提交的57份機器翻譯實踐報告中總結存在要存在的問題如下:1)長句翻譯問題最大。如英文原文本中的定語從句和狀語從句,在翻譯過程中,機器翻譯處理得過于冗長,晦澀難懂,邏輯不清。2)無法結合上下文語境,靈活地翻譯某些詞匯的意義。詞匯在語境中的意義發生轉移,沒有考慮語境意義,產生錯誤。大多數直接使用常用語義。忽略熟詞生義。3)譯文缺少一些相關的連詞連接,特別是表示邏輯關聯的詞語缺失。導致可讀性差,也使讀者理解產生偏差。4)遇到英文長難句的時候,沒有適當添加標點符號,讀者閱讀困難。機器翻譯并未關注標點符號等細節問題。5)逐字逐句翻譯,主要采用直譯的方法,生硬刻板,語義不通或者不符合表達習慣。6)漏譯、誤譯等問題比比皆是。7)文本中縮寫形式的處理,經常漏譯,錯譯。相關科普類詞匯翻譯得牛頭不對馬嘴。
4.1長句翻譯和機器翻譯的處理
這是一篇研究激光的科技類文章,第一句是長句,在線翻譯網站有兩種翻譯處理方法,第一是直接切分開,第二是置于句中做修飾語。有道翻譯的譯文:研究人員用一種可以從華盛頓特區延伸到巴爾的摩的光纖展示了有史以來最長的激光器。百度翻譯的譯文:研究人員用從華盛頓特區延伸到巴爾的摩的光纖展示了有史以來最長的激光器。這兩種方法都存在不足,直接切分開,會使原文的邏輯結構斷裂,而置于句中做修飾語,使得修飾語過長,不符合漢語的表達習慣,且閱讀起來有一定的困難。
4.2語境意義表達不足和機器翻譯的生搬硬套
在一篇和經濟類新聞報告相關的應用文本中,對于原句里兩次出現的斜體字Doingbusiness表達,谷歌翻譯在譯文中兩次均處理為《營商環境報告》,這是準確的。其他的機器翻譯也基本做到了至少一次的正確。只有360翻譯,在語篇處理時,都翻譯為“做生意”。在另一篇學生譯者選擇的有關信號傳輸的科技類文章中,出現了“duringthetrip”這一表達,由上下文可知,trip是指在信號傳輸的過程,而大多數網站都直譯為“旅程”。同一文本另一處,“offerahugeimprovementforvoiceanddatatransmissionsoverlongdistance”。多數機器翻譯處理為“該技術為遠距離語音和數據傳輸提供巨大的改進”。生搬硬套,譯文不符合中國讀者閱讀習慣。360翻譯譯為“該技術可以極大地改善語音和數據的遠距離傳輸”。處理得較為得當。PRL,在某一科技類文章中,指的是《物理預告快報》(Phys⁃icsReviewletters)期刊,沒有一個翻譯網站處理得當,全部是直接寫出縮寫形式PRL。
4.3標點符號等細節問題在機器翻譯中“不受重視”
百度翻譯的譯文:在加利福尼亞和夏威夷之間散落著漂浮著的飄飄綽號“太平洋大垃圾”補丁。有道翻譯的譯文:其中最大的一個位于加利福尼亞和夏威夷之間,到處都是漂浮物,被稱為太平洋大垃圾補丁。谷歌翻譯的譯文:其中最大的一個位于加利福尼亞和夏威夷之間——因此散落著漂浮物,它被稱為太平洋大垃圾補丁。搜狗翻譯的譯文:其中最大的位于中間加利福尼亞和夏威夷之間到處都是垃圾綽號“太平洋垃圾”補丁。360翻譯的譯文:其中最大的一個位于加利福尼亞和夏威夷之間一直都是垃圾綽號大太平洋垃圾補丁。五大網站的翻譯對于指示代詞these都沒有翻譯出來,可見以句子為翻譯單位的機器翻譯,無法聯系上下文,實現篇章的完整分析。五個在線翻譯網站對于該句中3個常見單詞的語境意義把握失誤,如patch都翻譯成“補丁”,明顯是錯誤的,應當理解為“pieceorareaofland”。另一處“nickname”直接翻譯為“綽號”,不夠準確,文中應理解為“becalled被稱為”,有道翻譯的處理較好。原句只有一處標點符號,即破折號,一般是對上一句的進一步說明,五大商用在線翻譯網站處理不同,三個在線翻譯網站生成的譯本中沒有任何標點,只有有道翻譯劃分意群,加上三處標點。另一處保留破折號。古代文獻中多沒有標點符號,后人為了方便閱讀加上了標點符號。對于中國人閱讀來看,標點符號的加入至關重要,特別對于長句斷句、意群劃分、方便閱讀起到重要作用。以上的機器翻譯完成情況不夠理想。
5結束語
人工智能翻譯還是比較難取代人工翻譯,特別在文學翻譯領域。有關藝術類,比如文學創作,繪畫,音樂等,很難被取代。文學作品講究真情實感,要求譯者了解時代背景,更貼合作者內心感受。但是翻譯人員可以充分利用AI技術的發展,提高自身的水平。機器翻譯可以取代一些重復煩瑣或科學性比較強的材料。谷歌翻譯等在線翻譯網站在翻譯單個句子的時候,處理得較好,但是在長句處理時仍需火候。在翻譯的工作中,起到的是“協助”的作用,而不能安全地取代人工翻譯。機器翻譯為譯者提供了一個大概的譯文框架,后期則需要譯者不斷地修訂、潤色以增加譯文的可讀性,促進信息的有效、正確傳遞。68%的學生譯者對機器翻譯的未來發展趨勢做出了預測:隨著科學技術的不斷進步,AI行業的前景勢必更加開闊。各類在線翻譯網站目前還處于研發的中期階段,相信未來幾年會更加完善。但盡管如此,AI并不能完全取代翻譯人員。82%的學生譯者在翻譯報告中,明確指明機器翻譯的研發和發展為人類的進步和文明做出極大貢獻,但無法代替人工翻譯。最佳的方式是人機互譯,機器翻譯為輔,人工翻譯為主。人工翻譯建立在機器翻譯完成初稿的基本上,在此版本上修訂。學生譯者在機器翻譯報告書寫時,保持清醒的頭腦,做出明確的判斷。這和機器翻譯的時代,所處在的階段是吻合的。
作者:許春翎 郭琦 單位:華僑大學