前言:中文期刊網精心挑選了句子翻譯在線范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
句子翻譯在線范文1
關鍵詞:LORANGE;BLEUS;ROUGE-L;ROUGE-S;自動元評價
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2017)05-0138-05
Abstract: This paper addressed an automatic meta-evaluation method of machine translation (MT) evaluation based on ORANGE-Limited ORANGE. It was adopted as the resources were limited, to evaluate the performances of the three metrics- BLEUS, ROUGE-L and ROUGE-S, which were based on n-gram and widely used in the domain of MT evaluation. Compared with the traditional method operated by human, this method can evaluate metrics automatically without extra human involvement other than using a set of reference translations. It only needed the average rank of the reference, and it was not influenced by the subjective factors. This method costed less and expended less time than the traditional one, which would have advantages to the parameter tuning and shortening system period. In this paper, we use this automatic meta-evaluation method to evaluate BLEUS, ROUGE-L and ROUGE-S on the Russian-Chinese dataset. The result shows that the ROUGE-L's performance is the best and that of BLEUS' is the worst, the ROUGE-S is worse than ROUGE-L but better than BLEUS. Also, the consistance and effectiveness of Limited ORANGE are verified through consistency test with human meta-evaluation results.
Key words: LORANGE; BLEUS; ROUGE-L; ROUGE-S; Automatic Meta-evaluation
1 概述
C器翻譯系統評測在機器翻譯領域起著重要的作用。它能夠對系統性能進行評估,使系統開發者及時得知系統存在的問題并加以改進;同時可以為用戶提供系統譯文質量評估的依據。國家語言文字工作委員會的機器翻譯系統評測規范[1]指出,機器翻譯評測一般分為人工評測和自動評測兩類。其中,人工評測主要由同時精通源語言和目標語言的專家主觀地對系統輸出譯文的忠實度和流利度進行打分;主觀性強,受外界因素影響比較大,代價高昂,評判周期長,無法適應機器翻譯系統修改及參數調整的進度,無形中延長了系統研發周期,難以向研發者和用戶提供高效的評測結果。于是,研究者更傾向于使用自動評測方法對系統譯文進行量化評估。因此自動評測成為機器翻譯領域的研究熱點之一。
眾多的自動評測方法性能孰優孰劣,如何進行評判也是一個值得研究的問題。比如BLEU只能在語料庫級進行評測,平滑后的BLEU(BLEUS)可以應用于句子級評測;鑒于基于連續n元語法的BLEU沒有考慮不連續子串之間的匹配,ROUGE基于不連續子串進行候選譯文和參考譯文匹配等等;這些自動評測方法的好壞,需要有一個統一的標準來衡量,即機器翻譯評測元評價。
機器翻譯評測元評價,即是運用一定的方法檢測哪個機器翻譯評測方法性能更優,主要分為人工元評價和自動元評價兩類。人工元評價,就是通過對自動評測分數與人工評測的忠實度和流利度分數求得相關系數;花銷大、主觀因素導致結果經常不一致、忠實度和流利度測評很難達到一致;系數越大,評測方法的性能越好。自動元評價,就是采用計算機通過機械、自動的方法實現對評測方法的評價;這種方法客觀、便捷、容易實現,不會受外界因素的影響而導致評價結果出現偏差。人工元評價由于人工的介入而存在許多不足,難以適應海量數據的信息處理需求,為此探究一種通用、客觀的自動元評價方法非常重要。
本文基于ORANGE[2],提出一種LORANGE (Limited ORANGE)自動元評價方法,在語料受限的情況下,對目前主流的基于n元語法的三個自動評測方法BLEUS、ROUGE-L和ROUGE-S的性能進行自動評價。為與人工元評價保持一致性,擬采用譯文的忠實度分數、流利度分數以及譯文相似度表征譯文信息,對候選譯文和參考譯文進行排序打分,來實現對自動評測方法性能的評估。整個過程除了人工提前翻譯好的參考譯文無需額外的人工介入,而且可以很好地應用于句子級評價。
2 幾種主流的自動評測方法簡介
2.1平滑BLEU
BLEU自2002年由Papineni等人[3]提出以來,被廣泛應用到各種評測活動中。BLEU通過計算系統候選譯文與人工參考譯文中連續n元語法的匹配個數,求得n元語法的準確率,并將各元語法的準確率通過幾何平均值將其融合,同時對比參考譯文短的候選譯文賦予定量的懲罰,如式(1)所示。
2.2 ROUGE-L
BLEU在對候選譯文和參考譯文之間的連續n元子串進行匹配時,并不能很好地描述遠距離不連續詞語之間的關系。為此,2004年,Lin提出基于不連續n元語法的ROUGE[4]方法,用以描述遠距離的一元詞匯之間的關系,比如ROUGE-L、ROUGE-S。
ROUGE-L基于最長公共子串(Longest Common Substring, LCS)計算候選譯文和參考譯文之間的相似度,同時考慮了準確率和召回率,并采用基于LCS的F-測度的方法來測量參考譯文X(長度為m)和候選譯文Y(長度為n)的相似度,如式(3)(4)(5)所示[5]。
2.3 ROUGE-S
ROUGE-L只記錄了最長公共子串的長度,無法區分不同空間位置的最長公共子串,而且]有記錄短于最長公共子串長度的相匹配的子串,對譯文相似度的描述略欠妥當。ROUGE-S基于不連續二元語法(Skip-bigram)來計算候選譯文和參考譯文的相似度,允許有任意間隔的順序二元語法進行匹配,類似于BLEU中的二元語法,但包含了不連續子串,因此ROUGE-S可以描述遠距離信息。比如“我愛中國”分詞后變為“我/愛/中國”,有C(3,2)=3個Skip-bigram (其中C為組合函數),分別為:“我/愛”、“我/中國”、“愛/中國”。假設參考譯文X長度為m,候選譯文Y長度為n,每個長度為len(針對漢語而言,譯文分詞后詞語的個數)的句子有C(len,2)個Skip-bigram,則ROUGE-S的計算如式(6)(7)(8)所示[5]。
3 LORANGE自動元評價研究
3.1 LORANGE
由于某些針對特定任務標注的數據或者可以應用到受限領域的數據依然比較匱乏,統計機器翻譯模型的訓練仍然面臨著嚴重的“數據稀疏”問題[6]。針對人工元評價方法的主觀性強、周期長、一致性較弱等問題,在ORANGE[2]的基礎上,本文提出LORANGE (Limited ORANGE)方法,在資源受限的情況下,對自動評測方法的性能進行評價。這種方法因為其客觀、簡潔、方便實現而使得自動元評價成為可能,縮減了人力資源的付出。
所謂LORANGE自動元評價,就是在語料資源比較有限,訓練集的規模不足夠大的情況下,輸出n-best候選譯文列表可讀性比較差,從而利用有限的語料資源,借助網絡在線翻譯系統輔助實現對自動評測方法性能的自動評價。本文擬采用網絡上比較成熟的俄漢在線翻譯系統的輸出漢語譯文作為實驗所需的候選譯文列表,俄漢對齊語料庫中的漢語句子作為參考譯文,然后通過對參考譯文和候選譯文進行特征選取并打分,得到參考譯文在譯文列表中的排序,以此來計算LORANGE得分。
給定一個源語言句子S,選擇目前國際國內主流的、性能比較穩定的4個在線翻譯系統――谷歌、百度、必應、有道,輔助實現機器翻譯評測元評價研究。本文基于俄漢雙語新聞句對齊語料庫,利用上述4個在線系統進行俄漢翻譯,得到4個在線翻譯系統對應的漢語輸出譯文形成候選譯文,并將經過人工句對齊之后的漢語譯文作為參考譯文,以此構建LORANGE元評價方法的實驗語料庫。通過4個候選譯文列表和對應的參考譯文,對每個待評價的自動評測方法進行如下計算:
(1) 合理選擇譯文特征,計算候選譯文列表和參考譯文的自動分數;
(2) 根據譯文得分對參考譯文和候選譯文進行排序,并且計算參考譯文的平均排序;
3.2 譯文排序關鍵技術研究
通過上述分析,最主要的問題是如何對譯文進行綜合排序?對于同一個源語言句子的譯文可以用一組特征來表示,每一個特征描述譯文的一個屬性,特征權重表示該特征對譯文的相對重要程度。任何與該譯文相關的信息都可以編碼為一個特征。為了與傳統人工元評價保持一致性,本文擬選取譯文忠實度分數ade、譯文流利度分數flu以及基于待評價自動評測方法的譯文相似度sim等3個特征來表征譯文信息。這些特征必須借助語言學知識來獲得。
統計機器翻譯的原理就是通過翻譯模型和語言模型建模、訓練然后解碼,如圖1所示,在所有可能的目標語言T中尋找概率最大的句子作為源語言句子S的翻譯結果[7]。根據貝葉斯公式,即為通過解碼尋找一個最接近于真實的目標語言句子
3.2.1譯文忠實度分數計算
通過上述分析,譯文忠實度分數通過翻譯模型概率來表示,即P(S|T),給定目標語言T的條件下源語言S的條件概率。概率值越高,譯文的忠實度分值越高。本文采用Moses(摩西)系統對翻譯模型進行訓練,采用GIZA++詞對齊工具來實現源語言與目標語言的詞對齊。
由于實驗語料來自4個不同在線俄漢翻譯系統譯文和人工參考譯文,它們不同于來自同一個開源統計機器翻譯系統的n-best候選譯文列表,因此要想對實驗中來自不同在線翻譯系統的漢語譯文和1個參考譯文求得翻譯模型的概率值,必須找到一個公共的“參考點”――本文選擇Moses系統的1-best譯文,并以此為基準,間接求得5個譯文的忠實度分值。
3.2.2譯文流利度分數計算
譯文流利度通過語言模型概率P(T)來體現,它為每個給定目標語言的詞語序列計算一個概率值,表示這個詞語序列在目標語中被表達的可能性。目前應用最為廣泛的是采用n元語法對語言模型建模,計算字符串W=w1,w2,…,wn的概率,如式(13)所示。
4 自動元評價方法性能分析
4.1 實驗語料及環境
實驗中,雙語句子數據集采用某句庫中包含新聞領域的52,892個俄漢雙語對齊句對[8]。針對這些俄漢雙語對齊語料,采用分層采樣的方式將其分為訓練集和測試集,其中測試集包括1,057個俄漢句對。同時在模型訓練過程中引入俄漢詞典共計247,075詞條,優化所訓練出的雙語短語對齊模型。
本文選取目前主流的且俄漢翻譯譯文可讀性較強的谷歌、百度、必應、有道等4個在線翻譯系統對俄語句子進行俄漢在線翻譯,得到其對應的漢語輸出譯文作為候選譯文列表,俄漢雙語對齊語料庫中的人工對齊的漢語句子作為參考譯文。
從圖2中可以看出,ROUGE-L的LORANGE得分最低,為0.003112,ROUGE-S次之為0.003160,BLEUS最高,達到0.003234。根據上文分析可知,ORANGE分數越低,自動評測方法的性能越好,故可得到,ROUGE-L的評測性能最優,ROUGE-S性能次之,BLEUS性能最差。其主要原因在于,ROUGE-L在評測過程中,基于最長公共子串進行譯文相似度比較,沒有設定固定的n元語法的長度,匹配比較靈活,不拘泥于n元語法的長度而使得譯文中匹配的n元語法數目受到限制;而ROUGE-S和BLEUS很好地體現了譯文中不同階n元語法的匹配情況,ROUGE-S融合了ROUGE-L和BLEUS的優點,既包括了BLEU的連續n元語法,又包括了ROUGE-L的不連續n元子串,在確保譯文忠實度的情況下,捕捉了譯文之間的遠距離詞語之間的關系,同時也確保了譯文的流利度,其性能要優于BLEUS。
4.3 驗結果一致性分析
為了驗證LORANGE自動元評價方法的有效性與可行性,采用統一的標準對谷歌、百度、必應、有道4個在線翻譯系統的俄漢在線翻譯輸出譯文的忠實度和流利度進行人工打分。自動評測得分高的系統人工評測得分也高,這表明自動打分與人工打分有著較高的相關性,這是一個自動評測方法所期望得到的結果。
本文采用皮爾森相關系數rxy來計算自動評測方法與人工評測得分的相關性。對于包含變量自動打分x和人工打分y的測試集上的數據點為{(xi,yi)},則自動打分x和人工打分y之間的皮爾森相關系數為:
由此實驗分析,橫坐標表示基于不同自動評測方法的自動打分,縱坐標表示人工打分,ade表示人工忠實度分數,flu表示人工流利度分數,并分別對忠實度和流利度添加了線性趨勢線,(1) BLEUS的忠實度和流利度的相關性都是三個評測方法中最差的。(2) ROUGE-L和ROUGE-S的流利度相關性基本相近,但是ROUGE-L的忠實度要優于ROUGE-S。(3) ROUGE-S的忠實度和流利度的相關性同樣好。由此可以分析得出,ROUGE-L的性能要優于ROUGE-S和BLEUS,BLEUS性能最差,上述LORANGE自動元評價方法測得的實驗結果與人工評價的結果是一致的。由此,LORANGE方法的一致性得以驗證。但是同時也可以看到,人工評價涉及忠實度和流利度相關系數兩項目標函數的最優化,其基于兩個目標函數的綜合評價結果與人的評分主觀因素有很大關系,而LORANGE自動元評價方法的客觀一致性使得機器翻譯評測元評價可操作性得以完美體現,評判結果客觀、清晰,能夠更加有力、快速地驗證評測方法性能的改善情況,能夠在某些特定任務領域或者語料資源不足夠豐富的語種研究上,增加自動化成分,解放部分人力資源。
5 結束語
本文主要基于ORANGE提出一種資源受限的LORANGE自動元評價方法,對自動評測方法的性能進行評價。這種方法除了需要人工提前準備好的參考譯文之外,不需要額外的人工介入,通過參考譯文的平均排序來實現對不同評測方法的自動元評價,參考譯文排序靠前的評測方法性能優于參考譯文排序靠后的評測方法。相比于傳統的人工元評價方法,大大縮短了評價時間,節約了能源。且在評測過程中,為了與傳統人工評測相一致,選取譯文的忠實度分數、流利度分數與基于待評測指標的譯文相似度三個特征來表征譯文,從而進行打分。并將實驗結果與人工元評價結果進行了一致性檢驗,LORANGE自動元評價方法的有效性得以驗證。
后期工作中將同義詞擴展等語義分析引入自動評測方法中,而且表征譯文的三個特征的選取與計算還將進一步優化,從而將語義分析引入LORANGE自動元評價過程中。
參考文獻:
[1] 機器翻譯系統評測規范[S]. 中華人民共和國教育部國家語言文字工作委員會. 2006.
[2] Lin C. Y., Och F. J.. ORANGE: A Method for Evaluating Automatic Evaluation Metrics for Machine Translation [C]. In Proceedings of the International Committee on Computational Linguistics 2004 (COLING-2004), 2004.
[3] Papinen K., Roukos S., Ward T., et al. BLEU: a method for automatic evaluation of machine translation [C]. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics 2003 (ACL 2003), 2002: 311-318.
[4] Lin C. Y.. ROUGE: A Package for Automatic Evaluation of Summaries [C]. In Proceedings of Workshop on Text Summarization Branches Out, Post-Conference Workshop of Association for Computational Linguistics 2004 (ACL 2004), 2004.
[5] Lin C. Y., Och F. J.. Automatic Evaluation of Machine Translation Quality Using Longest Common Subsequence and Skip-Bigram Statistics [C]. In Proceedings of Association for Computational Linguistics 2004 (ACL 2004), 2004.
[6] 張鈸. 自然語言處理的計算模型[J]. 中文信息學報, 2007, 21(3): 3-7.
句子翻譯在線范文2
關鍵詞:統計機器翻譯; 對數線性模型; 判別式訓練
中圖分類號:TP391.2 文獻標識碼:A文章編號:2095-2163(2013)06-0014-04
0引言
統計方法[1]已經成為機器翻譯建模的主流方法,特別在Och和Ney[2]提出了基于對數線性模型的統計機器翻譯模型之后。目前,幾乎所有的統計機器翻譯系統都處于對數線性模型框架的支持和限定之下。與產生式的翻譯模型[1]相比,對數線性翻譯模型不需要考慮翻譯的生成過程,可直接采用判別式的統計模型建模;其最大優點在于,能夠允許加入任意的翻譯特征。因而,可將翻譯的問題轉化為特征工程的問題,這就為翻譯系統的研究和設計帶來很大的便利。
假設f是一個源語言句子,e為其一個可能的翻譯。形式上,基于對數線性(最大熵)的翻譯模型[2],可以表述如下:
P(e|f:W)=exp(∑iWi·hi(f,e))∑e′exp(∑iWi·hi(f,e′))(1)
其中,e′是f所有可能的一個翻譯;h1是雙語對(f,e)的特征,其取值為實數;W=是一個d維的向量,表示模型的參數,其中每個分量Wi都是一個實數,表示特征hi的權重;∑e′exp(∑iWi·hi(f,e′))表示歸一化因子。那么,給定一個參數W,對于每個源語言f, 尋找其最優翻譯(f;W)的過程可以看成如下的一個優化問題:
(f;W)=argmaxeP(e|f:W)=argmaxe∑iWi·hi(f,e)(2)
上式也稱為最大后驗解碼原則。那么如何事先確定這個參數W呢?其準則又是什么呢?這就是判別式訓練的問題。具體來說,判別式訓練的任務是,給定一個開發集,優化得到一個合理的參數W,使得這個參數在測試時性能良好。
機器翻譯任務本身固有的一些特點,比如翻譯模型中的隱含變量和結構化的搜索空間等等,導致翻譯模型的參數估計存在很多困難。不過,經過數十年的發展歷程,大批研究者相繼提出了許多訓練方法,這些方法極大地推動了統計機器翻譯的進展。但是,據研究所知,目前還沒有工作就這些方法進行系統地闡述與介紹。本文中,將系統地回顧這些方法,同時就這些方法的優缺點進行分析與討論,旨在使更多的研究者能夠深入了解判別式訓練方法的發展現狀、為判別式訓練的進一步發展起到基礎性地引領作用。
1基于似然函數的訓練方法
首先,為行文約定一些記號:設(f,e)為一個雙語對,其中f為源語言,e是其一個翻譯。給定開發集{fs,cs,rs}Ss=1,其中fs是開發集中的源語言句子,cs是fs的一個候選翻譯集合,rs是fs的參考譯文集,其中每個元素記為rks,k=1,…,Ls,Ls為rs中元素的個數。
既然是估計概率模型的參數,就必然不能缺少極大似然估計,因為這是概率模型參數估計的典型方法。事實上,在文獻[2]提出最大熵翻譯模型的框架時,其中采用的參數學習方法就是極大似然估計法。自然地,{fs,cs,rs}Ss=1上的對數似然函數的定義如下式:
∑Ss=11Ls∑Lsk=1logP(rks|fs;W)(3)
然而,由于某些rks是不可達的,這樣,無法計算其所對應的似然函數。Och 和Ney[2]采用如下的方法來近似上述似然函數,即從fs可達的那些翻譯中,比如對fs進行k-best解碼得到的譯文集cs都是可達的,從中選取若干個與參考譯文集最相似的譯文(依據句子級別的BLEU,定義相似度),作為偽參考譯文,這些偽參考譯文集記為eks,為方便起見,假設參考譯文集亦含有Ls個元素。那么基于偽參考譯文集的似然函數為:
∑Ss=11Ls∑Lsk=1logP(eks|fs;W)(4)
最小化公式(4)的一個難點是候選翻譯的指數級空間,而精確地計算公式(1)中的歸一化因子也很困難,因此,需要借助于合理的近似策略。 Och 和Ney[2]采用的方法是使解碼器輸出k-best候選翻譯集cs,并在cs上近似地計算歸一化因子。其后就是典型的優化問題,通用優化方法都可以實現公式(4)的優化,比如梯度法,共軛梯度、擬牛頓法(LBFGS)等等,Och 和Ney[2]采用了GIS算法。
需要注意的是,由于似然函數是嚴格凸函數,最大似然估計方法可以為公式 (4)找到全局最優解。盡管如此,這種方法在實際的翻譯任務中效果并不好,目前幾乎已經不再采用。然而,這種利用k-best候選翻譯來代替整個翻譯候選空間的思想,對后續的參數學習算法起著十分重要的作用。更具體地說,其后許多著名的參數學習算法都嵌入在這種框架之內,所不同的只是,這些算法采用的優化目標各不相同而已。
2基于錯誤率的訓練方法
極大似然估計的一個缺點是,沒有直接利用翻譯的評價度量比如BLEU[3],來作為優化的目標函數,導致了優化目標同翻譯評價度量之間的關系不太緊密、一致。
為此,Och 在2003年提出了最小錯誤率訓練(簡記,MERT)的方法[4],其想法是,直接利用翻譯評價度量作為優化的目標函數,以期能夠得到最優的參數,使得在開發集上該參數得到的翻譯結果的BLEU 值最高。MERT是機器翻譯參數估計方法中最通用、最成功和最受歡迎的算法。在每屆翻譯評測中,幾乎所有的翻譯系統都采用MERT進行參數估計。形式上,MERT試圖解決如下的優化問題:
minWE{rs,(fs;W)}Ss=1(5)
其中,(fs;W)表示在翻譯候選集cs中,根據權重W,按照最大解碼原則公式(2)而得到的一個翻譯。在式(5)中,E是一個篇章級的翻譯評價度量,表示翻譯文檔 {(fs;W)}Ss=1在參考譯文{rs}Ss=1下的評價得分,比如篇章級的BLEU;其他的記號如前所述。公式(5)的目標函數稱為錯誤率函數。由于公式(5)中的錯誤率函數不可導,甚至不連續,因而,一般的梯度方法并不適用,有效地求解公式(5)存在困難。
本質上說,MERT是一種特殊的Powell算法,可啟發式地選擇坐標向量作為搜索方向。該算法的思路是,每次都選用所有坐標向量作為搜索方向,然后沿著每個搜索方向進行線搜索(line search)得到一個點;比較所有坐標方向上的線搜索得到的點的目標函數值,選擇目標函數值最小的點作為下次迭代的起點;上述兩個步驟反復下去,直至算法收斂。MERT的最大貢獻在于,能夠在多項式的時間內執行精確的線搜索(exact line search),也即是,在給定的方向上能夠找到該方向使目標函數值最小的點。MERT的精確線搜索可以解釋如下。假設開發集中僅僅含有一個句子,并假設當前的搜索方向是第j個坐標方向,公式(5)關于參數Wj是分段線性函數,而且函數至多有Ls個線性的片段。這樣,遍歷這個分段線性函數就可以找到最小值點Wmaxj。對于開發集含有多個句子的情況,只需要組合多個分段線性函數,算法的思想也與其類似。值得注意的是,雖然MERT在線搜索時,可以找到全局最優的點,但是整個算法不能保證必定收斂到全局最小點。相似地,Zhao等[5]提出了另外一種非梯度的方法-單純型法最小化公式(5)。
由于公式(5)中的目標函數是非凸的,導致上述方法不可避免地陷入到局部最優的境地。原始的MERT算法沒有考慮局部最優的問題,這樣,如何避免性能不好的局部最優點就自然成為一個重要的研究課題。Moore和Quirk[6]在MERT中引入了隨機初始點的策略以避開性能不好的局部最優點。具體來說,就是在MERT迭代過程中,定義了兩種隨機方法,這兩種方法不同之處在于產生隨機初始點的方式不同。第一種方法是隨機初始化,是按照均勻分布產生多個初始點,對每個初始點都運行一遍MERT,就可以得到多個局部最優點,再比較這幾個局部點對應的BLEU值,選擇BLEU值最高的那個局部最優點。第二種方法是隨機行走,是在上次選擇的局部點的基礎上,引入標準的高斯噪聲,抽樣出一個處于局部點周圍的初始點,并運行MERT得到另外一個局部最優點,再比較新舊兩個局部對應的BLEU值,以決定是否接受新的局部最優點。Galley和Quirk[7]則利用組合優化的方法,尋找到公式(5)的全局最優解。其主要思想同MERT中的精確線搜索相似,不同于MERT中精確線搜索的地方就在于求解一個一維的分段線性函數,并計算一個多維的分段線性函數。換句話說,該方法不是按照某一個坐標向量計算公式(5),而是對所有的方向計算公式(5),同時將多變量的優化公式(5)轉化成一個線性規劃問題。詳細做法是,將各獨立句子的k-best翻譯列表中的每個候選翻譯的特征向量都對應于一個多維歐式空間中的點,再利用線性規劃的方法計算k-best翻譯列表對應的集合的最小凸包,并根據所得到最小凸包就可以求得公式(5)的解;其次,將每個句子的最小凸包進行組合,就可以得到公式(5)中對應的分段線性的目標函數(關于參數W),遍歷這個分段線性函數可以找到最優的解。這個方法的最大貢獻是,方法表明了公式(5)可以找到全局最優解,但是,其算法復雜度卻是指數級的,因此,不宜推廣到規模很大的開發集上。
如前所述,公式(5)中的錯誤率函數是分段線性的,具有許多局部最小值的區域。由于錯誤率函數的形狀錯綜復雜,高峰和低谷的分布異常不均勻。這樣導致的結果是,對于不同的開發集,所對應的錯誤率函數的最小值區域并不具有一致性。因此,即使是找到了公式(5)的(局部)最小值點,公式(5)的最小值點附近區域的其他點的錯誤率函數值也有可能會達到很高。如此,該最小值點的推廣能力未必是最好的。為了避免這種情況的發生,許多研究者為MERT提出了正則的方法,以避免找到推廣能力不好的(局部)最優點。Smith和eisner[8]采用光滑的函數來逼近錯誤率函數,以減少錯誤率函數的“尖銳點”現象。通過使用一個期望風險函數來取代公式(5)中的目標函數:
minWExpectation(W;l)=minW∑Ss=1∑e∈csl(e)P(e|fs;W)(6)
其中,l(e)表示與參考譯文相比e具有的損失值, 和公式(5)中E的意義一樣,不同的只是,這是定義在句子級別而已。公式(6)也即MBR的最小風險準則。值得注意的是,公式(6)是連續可微的,是公式(5)的“光滑逼近”。同Smith和Eisner采用光滑逼近的技術實現正則不同,Cer等[9]采用了離散正則的方法。其主要思想是,在評價某一個權重向量時,不僅考慮這個向量所在的線性區域(因為公式(5)中的目標函數是分片線性的)對應的BLEU值,而且考慮這個區域附近的k個其他線性區域的BLEU得分情況。對于每個線性區域的目標BLEU值,則提出了兩種組合方法。一種是max, 定義了每個線性區的BLEU值為該區域的k個附近區域的BLEU值最高值。另一種方法是average, 則將這個線性區域的BLEU值定義為k個附近區域BLEU值的平均值。
3可擴展的訓練方法
參數估計方法的可擴展性是一個重要的研究問題,也是近幾年的一個研究熱點。其中的原因是,對數線性模型的一大優點就是可以很靈活地增加特征,而且,現有的研究表明[10],增加大量的特征有利于提高翻譯的性能。為此,MERT就面臨著一個重要的問題,其可擴展性不好。需要強調的是,這里的可擴展性是指,在翻譯模型的特征不斷增加時,MERT的性能會下降;而并不是指MERT在算法效率上的可擴展問題。比如,Chiang等[10]的實驗表明,MERT在翻譯模型的維數小于30時,性能很好;維數大于50時,性能將變得不好。其中一個可能的原因是,公式(5)的錯誤率函數是非凸的,隨著維數的增加,陷入局部最優的可能性也就越大。為此,許多研究者在這方面提出了具有可擴展性的參數估計方法。Liang等[11]基于感知器的在線學習算法,提出了一種可以優化大量特征的翻譯模型。算法的主要思路是:對于源語言fs的參考譯文rs和候選譯文e′s,那么權重就應該滿足:P(rs|fs;W)>P(e′s|fs;W), 即,W·h(rs,fs)>W·h(e′s fs)。在此,可以使用感知器更新公式:
WW+h(rs, fs)-h(e′s, fs)(7)
由于參考譯文rs可能會不可達,文中提出3種權重更新策略:激進的更新,局部的更新和混合更新方法。激進的更新僅對于參考譯文能可達句子,按照公式(7)更新權重;而對于那些參考譯本不可達的句子,直接不予考慮更新。局部更新的對象是對所有的句子都進行更新,其做法是使解碼器輸出k-best候選翻譯,將k-best翻譯中BLEU 分最高的翻譯代替公式(7)中的rs,其他的翻譯代替e′s,按照公式(7)更新k-1次。組合的更新方法結合前兩種更新方式:如果參考譯文可達,執行魯莽的更新;否則,執行局部更新。相似地,Tillmann和Zhang[12]采用隨機梯度的在線更新算法學規模特征的翻譯模型權重。
Watanabe等[13]以及Chiang等[10]提出了基于大邊緣融合松弛(MIRA)算法[14]的翻譯模型參數估計方法。同Liang及Tillmann和Zhang的方法一樣,這也是一個在線的學習。設當前迭代的權重為Wt;解碼器為更新權重由開發集中挑選的句子集{ftk}Bk=1,其中,B為批量大?。˙atch size)。那么,更新后的權重Wt+1為如下二次優化問題的解:
其中,λ為大于0的正則系數,O tk(tk)為性能較好(不好)的翻譯集,r tk為ftk的參考譯文集,l(ek,e′k,rtk)為根據rtk評價ek和e′k的句子級BLEU之差。如何挑選O tk(tk)對翻譯的性能具有一定的影響,Watanabe等[13]以及Chiang等[10]從k-best 翻譯列表或者超圖中選擇句子級BLEU最高(最低)的前幾個候選翻譯構成O tk(tk)。公式(8)對應的二次優化問題可以使用SMO[15]進行求解。MIRA算法的一個缺點是,需要設定很多參數,比如λ和O tk(tk)選擇所必需的一些參數。不同于上述對MIRA采取在線的更新算法,Cherry和Foster[16]提出了一個批處理的MIRA訓練算法。該算法與MERT一樣,對開發集中的所有句子,執行一次二次優化。另外,Hopkins和May[17]將翻譯模型的參數學習問題看做是排序問題,然后將其轉化成了普通的分類問題,并采用開源的分類器實現算法。算法實現簡單,而且實驗表明也十分有效,同時,還具有很好的可擴展性。受該算法啟發,Watanabe[18]提出了一個基于排序的在線學習算法。相似地,文獻Bazrafshan等[19]將翻譯模型的參數學習問題轉化成了一個線性回歸問題。同基于排序的二值分類問題相比,這一方法不但獲得了更好的翻譯性能,而且還具有更好的收斂速度。
4結束語
判別式訓練是基于對數線性的統計機器翻譯中最重要的一個組成部分。本文在充分調研和深入分析的基礎上,對現有的所有主流的訓練方法進行了綜述。本文主要從似然函數、錯誤率函數和可擴展的方法三個方面,闡述并分析了各個訓練方法的優缺點。判別式訓練方法的研究至今只有數十年,而且統計機器翻譯本身具有諸多的復雜性制約,目前還有許多問題有待于更深一步的研究和探討。基于目前關于判別式訓練的研究經驗,本文在最后提出一些未來值得進一步挖掘的研究問題,希望對這方面的研究者在未來的研究中有所啟發,進而為判別式訓練的進一步發展乃至統計機器翻譯的發展起到推動作用。
首先,對于結構化學習問題,在精確的解碼框架下,其判別式訓練有著良好的理論基礎[20]。然而在機器翻譯中,翻譯模型通常會包含全局的特征比如語言模型,動態規劃的技術則無法采用,因此精確解碼是不可能的,往往采用基于柱狀搜索的非精確解碼方法。非精確解碼導致的后果是,算法的收斂性很難得到保證,實際上,現有的判別式訓練算法是否能夠收斂?需要經過多少次解碼迭代才能收斂?這都沒有獲得理論上的保證。黃亮等[21]指出,當非精確解碼滿足一定的條件時,收斂性就能夠得到保證。因此,可否將現有的解碼方式進行適當的修改,以滿足黃亮等提出的關于非精確解碼的條件?或者可否重新探索滿足新的收斂條件和新的解碼方式。
其次,對于判別式訓練而言,其最終目標是,對于優化得到的權重而言,翻譯度量最好翻譯對應的模型得分,要大于其他候選翻譯的模型得分。由于翻譯評價度量不能定義在翻譯單元上,而翻譯的解碼卻需要按照翻譯單元進行擴展,這就使得訓練時幾乎不能找到質量最好的翻譯。因而,在實踐中,機器翻譯在訓練的過程中,僅僅考慮翻譯模型得分最好的k-best候選翻譯,而后又在k-best翻譯候選中考慮質量最好的翻譯。由于k-best僅僅是指數級別翻譯空間中一個粗糙的近似,這種近似會影響到判別式訓練的效果。那么如何在解碼搜索中同時兼顧考慮翻譯評價度量就是一個重要的問題。
參考文獻:
[1]BROWN P F, PIETRA V J D, PIETRA S A D, et al. The mathematics of statistical machine translation: parameter estimation. comput. Linguist. 1993,19:263–311.
[2]OCH F J, NEY H. Discriminative training and maximum entropy models for statistical machine translation[C]//Proc. of ACL. PA, USA, 2002:295–302.
[3]PAPINENI K, ROUKOS S, WARD T, et al. Bleu: a method for automatic evaluation of machine translation[C]//Proc. of ACL. Philadelphia, Pennsylvania, USA, 2002:311–318.
[4]OCH F J. Minimum error rate training in statistical machine translation[C]//Proc. of ACL. Sapporo, Japan, 2003:160–167.
[5]ZHAO B, CHEN S. A simplex armijo downhill algorithm for optimizing statistical machine translation decoding parameters[C]//Proc. of NAACL. Stroudsburg, PA, USA, 2009:21–24.
[6]MOORE R C, QUIRK C. Random restarts in minimum error rate training for statistical machine translation[C]//Proc. of COLing. Stroudsburg, PA, USA, 2008:585–592.
[7]GALLEY M, QUIRK C. Optimal search for minimum error rate training[C]//Proc. of EMNLP. Edinburgh, Scotland, UK., 2011:38–49.
[8]SMITH D A, EISNER J. Minimum risk annealing for training log-linear models[C]//Proc. of COLING-ACL. Sydney, Australia, 2006:787–794.
[9]CER D, JURAFSKY D, MANNING C D. Regularization and search for minimum error rate training[C]//Proc. of the Third Workshop on SMT, 2008.
[10]CHIANG D, MARTON Y, RESNIK P. Online large-margin training of syntactic and structural translation features[C]//Proc. of EMNLP,2008.
[11]LIANG P, BOUCHARD-C^OT^E A, KLEIN D, et al. An end-to-end discriminative approach to machine translation[C]// Proc. of ACL. Sydney,Australia, 2006:761–768.
[12]TILLMANN C, ZHANG T. A discriminative global training algorithm for statistical Mt[C]//Proc. of ACL. Stroudsburg, PA, USA, 2006:721–728.
[13]WATANABE T, SUZUKI J, TSUKADA H, et al. Online large-margin training for statistical machine translation[C]//Proc. of EMNLP-CoNLL. Prague, Czech Republic, 2007:764–773.
[14]CRAMMER K, SINGER Y. Ultraconservative online algorithms for multiclass problems[J]. Mach. Learn. Res, 2003, 3:951–991.
[15]PLATT J. Fast training of Support vector machines using sequential minimal optimization. SCHOELKOPF B, BURGES C, SMOLA A, (Editors) Advances in Kernel Methods - Support Vector Learning, MIT Press, 1998.
[16]CHERRY C, FOSTER G. Batch tuning strategies for Statistical Machine Translation[C]//Proc. of NAACL. Montrieal, Canada, 2012: 427–436.
[17]HOPKINS M, MAY J. Tuning as ranking[C]//Proc. of EMNLP. Edinburgh, Scotland, UK., 2011:1352–1362.
[18]WATANABE T. Optimized online rank learning for machine translation[C]//Proc. of NAACL. Montrieal, Canada, 2012:253–262.
[19]BAZRAFSHAN M, CHUNG T, GILDEA D. Tuning as linear regression[C]//Proc. of NAACL. Montreal, Canada, 2012:543–547.
[20]COLLINS M. Discriminative training methods for Hidden Markov Models: theory and experiments with Perceptron Algorithms[C]//Proc. of EMNLP, 2002.
[21]HUANG L, FAYONG S, GUO Y. Structured perceptron with inexact search[C]//Proc. of NAACL. Montrieal, Canada, 2012:142–151.
[14]AKAGI T, SUGENO M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Transactions on Systems, Man, and, Cybernetics, 1985,15(1): 116-132.
[15]黃福員. 金融風險預警的MPSO-FNN模型構建與應用[J]. 計算機工程與應用,2009,45(14):210-212.
[16]ALTMAN E I, MARCO G, VARETTO F. Corporate distress diagnosis: comparisons using linear discriminant Ana analysis and neural networks[J]. Journal of Banking and Finance, 1994, 18: 505-529.
[17]李志輝, 李萌. 我國商業銀行信用風險識別模型及其實證研究[J]. 經濟科學, 2005(5): 61-71.
句子翻譯在線范文3
【關鍵詞】詩歌翻譯 葉芝 計算機輔助翻譯 互聯網
一、計算機輔助翻譯工具應用于When You Are Old翻譯中
1.金山詞霸的翻譯
When you are old and gray and full of sleep,And nodding by the fire/take down this book, And slowly read, and dream of the soft look /Your eyes had once, and of their shadows deep/How many loved your moments of grad grace, And loved your beauty with love false or true; But one man loved the pilgrim soul in you.
And loved the sorrows of your changing face
And bending down beside the glowing bars, Murmur, a little sadly, how love fled
And paced upon the mountains overhead, And hid his face amid a crowd of stars.
當你白發蒼蒼,睡意/爐火旁打盹,請取下這本書/慢慢讀,回想你過去眼神的柔和/你的眼睛曾經,和深深的陰影/多少人愛你畢業時的優雅/愛過你的美貌,或真或假/唯獨一人愛你朝圣者的靈魂/愛你衰老了的臉上痛苦;你坐在火爐旁/雜音,遺憾,那愛情的消逝/在頭頂的山上,將臉隱沒在繁星。
翻譯結果總體讓人滿意,但在少數選詞及意向解釋時存漏洞。歧義與多義這兩種自然語言中普遍存在的現象給計算機輔助翻譯工具帶來了許多困難 。以“Murmur”為例,有“咕噥;低聲的抱怨;發出雜音”的意思。由于計算機翻譯缺少聯系上下文的能力,金山詞霸翻譯成了最為不合適的意向“雜音”。這里選擇把“Murmur”譯為“默吟”更為合適。
2.百度在線的翻譯
當你老了,灰色和充分的睡眠/爐火旁打盹,取下這本書/慢慢讀,回想你過去眼神的柔和/你的眼睛曾經,和深深的陰影;
多少人愛過你的美麗/愛過你的美貌,或真或假,唯獨一人愛你朝圣者的靈魂/愛你衰老了的臉上痛苦;你坐在火爐旁/雜音,有點遺憾的是,那愛情的消逝
在頭頂的山,將臉隱沒在繁星。
百度翻譯代表的在線翻譯,資源廣泛,共享信息豐富,能最大限的獲取已有的翻譯成果。它把“How many loved your moments of grad grace”翻譯為 “多少人愛過你的美麗”就是直接使用了互聯網已有語料。但把“And loved the sorrows of your changing face”翻譯為“愛你衰老了的臉上痛苦”,可能是“痛苦”一詞在互聯網的大數據中使用頻率較高,并不恰當。詩歌翻譯有時只需翻譯出詩歌的情緒,直譯在此處非常突兀。
3.雪人軟件的翻譯
當你老了,頭發花白,睡意沉沉/倦坐在爐邊,取下這本書來/慢慢讀著,追夢當年的眼神那柔美的神采與深幽的暈影/夢見你當年的雙眼,那柔美的光芒與青幽的暈影;多少人愛你青春歡暢的時辰愛慕你的美貌,假意或是真心/只有一個人愛你圣潔的靈魂,愛你那飽經風霜哀戚的容顏/熾熱的爐柵邊,你彎下腰,凄然地輕輕訴說那愛情的消逝/在頭頂的山上,它緩緩踱著步子,逝去的愛,如今已步上高山,他的面容隱沒在繁星之中。
雪人翻譯軟件把原文本以句為單位,分成翻譯單元。并引入記憶庫,片段搜索,在線詞典,在線搜索,最終達到翻譯目的。在這里,在線詞典導入的是必應詞典,在線搜索導入的是維基百科,得到比較優質的譯文??梢哉f雪人翻譯軟件是前兩種在線詞典和在線搜索的集合體。再加上其可以導入一定的記憶庫與強大的片段搜索,這款軟件還是比較適合。但中英兩種語言的巨大差異決定了計算機輔助翻譯復雜性 ,如“And slowly read, and dream of the soft look ”翻譯成“慢慢讀著,追夢當年的眼神那柔美的神采與深幽的暈影”。翻譯腔濃厚,不符合中文上下句子結構美。
二、計算機輔助翻譯在詩歌翻譯中的試用
以上三種計算機輔助翻譯工具在翻譯When You Are Old 中,使用效果讓人滿意。雖然理論上計算機輔助翻譯更適用于科技、法律等文本翻譯。但由于現在網絡提過了強大的預料資源,這決定了在一定程度上成就了通過計算機輔助軟件進行詩歌翻譯的可能性。但同時我們也要看到,由于漢語本身特點,如漢字的多義,漢語的流水小短句和詩歌翻譯中已有的固定意向,計算機輔助翻譯并不能完全代替譯者進行工作??菰镏貜偷牟糠钟捎嬎銠C完成,需要創作靈活思維的部分由人腦完成 ,二者共同協作,以求優質高效的目標文本。
參考文獻:
[1]梁愛林.計算機輔助翻譯的優勢和局限性[J].中國民航飛行學院學報.2004(01).
句子翻譯在線范文4
科技英語不同于文學文本,不以語言的藝術美為追求目標,它在遣詞造句上講究邏輯的條理性與思維的準確性??萍加⒄Z用詞準確、簡潔規范、陳述客觀、結構嚴密、邏輯性強。其顯著特點有:被動句多,名詞化結構多,長句多。長句的大量使用是科技英語的一個重要特點??萍加⒄Z在敘述上真實客觀、思維嚴謹、邏輯完整。在事實推導過程中,為了完整說明理論的來龍去脈,往往采取一氣呵成的方式陳述,這樣,從句疊加的復雜句式結構在科技英語里極為普遍,修飾語的使用較頻繁。并列結構、從屬結構、倒裝語序等是長句特點。因此,長句翻譯是一個復雜的問題。譯員要打下扎實的語言基礎,擁有精準的專業知識,準確把握句子主干,即主語、謂語、賓語、定語、狀語等,分析句子之間的邏輯關系,翻譯出通順精準的譯文。被動語態在科技英語文章中被廣泛應用,是科技英語的另一個特征。科技論文很少使用人稱描述某個客觀事物,科技英語注重客觀陳述、邏輯推理,避免表露個人感情,行為的執行者一般要隱身以避免主觀臆斷。這與文學作品的文體特征有很大區別。文學作品中的人物、事件是敘述中必不可少的因素,對于科技文體,文章內容、觀點與思想才是讀者關心的內容,行文的客觀性與可信度是至關重要的,因此被動語態普遍應用于科技英語中。更重要的是,科技文獻強調研究成果、客觀理論、科學規律,引導讀者把注意力投放在科技現象與過程上,而不是偏向于介紹發明者。科技文章結構嚴密、用詞簡潔、數據精確、表達確切。由于其專業性強,邏輯嚴密,表達明晰,因此對譯員的要求非常高。譯員應該把握信息的邏輯關系,提高譯文的客觀度,力求譯文表達簡練無誤、流暢嚴謹,不隨意改動數據。
二、科技英語翻譯標準
在翻譯界,“信、達、雅”是人們首先想到的翻譯標準。對于科技文本的翻譯,譯者不僅要具備較高的翻譯能力,還要把握日新月異的科學技術發展動態及科學研究前沿工作,把各學科知識有機結合起來。因此,譯者要有扎實的英語閱讀能力、豐富的科技知識,并進行長時間的訓練,保證譯文忠實于原文。
1.準確無誤譯員應該對原文進行語言與專業分析,吃透原文,對譯文內容不斷推敲,確保譯文簡潔明晰、準確到位、忠實通順,并與原文風格對應。原文與譯文應該具有等價性,即信息是如實轉換的,同時要符合目的語讀者的閱讀習慣,使信息無障礙地傳遞原文信息。
2.連貫通順英漢語言在詞匯與結構上有較大差異,譯員除了要把握英漢兩種語言在詞匯、語法、句式結構、語法規則等方面的差異外,還要具備科技專業的相關基礎知識及快速的邏輯思維能力。譯者要把握科技英語表達特點,注重邏輯縝密,使譯文具備極強的說服力。譯文上下銜接應流暢通順,符合目的語讀者的語言表達習慣。
3.科學規范科技英語專業性強、簡練無誤、客觀真實??茖W規范的術語表達可以提高譯文的質量與可信度。科技英語翻譯過程不同于文學翻譯過程中的再創造,譯員不能天馬行空地自由翻譯,也不能發揮主觀想象,而應該用心鉆研,熟悉科技英語遣詞造句的特點,力求用詞規范。
三、教學改革
隨著科學技術的不斷發展,以及科技信息與文獻資料的頻繁交流,科技翻譯工作的重要性日漸突出,這就對大學翻譯教學提出了更高要求。雖然很多高校英語專業都開設了科技英語翻譯課程,但由于教師基本都是文科出身,對科技知識了解不足,教學效果可想而知。社會對翻譯專業畢業生的要求越來越高,他們必須能夠勝任科學資料、合同與技術會談等的翻譯工作,由此看來,學??萍挤g教學改革已刻不容緩。
1.教學內容改革加強與理工科專業的教學合作,邀請理工科專業教師任教,傳授科技專業知識,同時為老師提供機會,進行相關科技專業的學習與培訓。教材的編排應該循序漸進、由易到難。首先利用通俗易懂的科普文章提高學生的學習興趣,然后使用難度稍大的專業論文增加學生的科技專業知識。引導學生將理論學習應用于翻譯訓練中。教師實施任務教學法,讓學生進行分組翻譯訓練,在團隊合作中相互學習與切磋,完成任務后,進行小組互評。這種方式可以讓學生了解自身的優勢與不足,提高對科技英語翻譯的積極性。教師應鼓勵學生積極參加校內外國際會議與報告講座,積極參加翻譯公司的實習,負責一定量的科技翻譯工作,盡量為學生創造實踐翻譯機會與環境,將理論應用于實踐。
2.邏輯思維訓練為了透徹清晰地表達事物間的內在邏輯聯系,科技文章里的長句頻繁出現。翻譯專業學生多為文科生,思維方式趨于感性。因此,在翻譯訓練中,教師應著重培養學生的邏輯思維能力。在開始學習階段,引導學生講評譯文,相互討論,推導句子、段落、文章的層次與邏輯關系,在合作與相互幫助中,讓學生進行思維的引申和發揮。這一方法既可以讓學生在枯燥乏味的專業詞匯中感受到樂趣與意義,又可以讓學生逐漸習慣理性與邏輯思維。學生的邏輯分析能力在不斷訓練與強化中得到提高。
句子翻譯在線范文5
關鍵詞:漢語學習詞典;需求分析;國別化
中圖分類號:H314 文獻標識碼:A 文章編號:1673-2596(2013)11-0204-04
隨著漢語國際推廣的進一步發展,特別是孔子學院在全球各地的設立,世界各國學習漢語的人數量迅猛增長。學習者對漢語學習的輔助工具書提出了更高的要求。我們目前能看到的漢語學習詞典(Learner’s dictionary)主要有孫全洲主編的《現代漢語學習詞典》(1995)、李曉琪主編的《現代漢語常用詞用法詞典》(1997)、劉鐮力主編的《漢語8000詞詞典》(2000)、魯健驥主編的《商務館學漢語詞典》(2006)以及徐玉編的《當代漢語學習詞典:初級本》(2005)等?,F有的學習詞典大體上結構相似,大部分采用單語、紙質形式,在選詞、詞性標注、義項分立、例句選取等方面多存在可行性不夠、實用性不強等問題,在一定程度上影響了詞典的推廣。對此,近年來很多學者撰文提出,對外漢語教學使用的漢語學習詞典與為漢語母語者使用的內向型漢語詞典不同,屬于外向型詞典,同時應該是積極型詞典,要能夠積極地引導語言學習者有效地使用語言并再生言語、發展言語,進而達到能夠順利地進行交際的目的。本文擬在前人研究的基礎上,參照國內外英語學習詞典編寫的理念與實踐,對國別化漢語初學者學習詞典的設計與編寫進行初步的探討,以期拋磚引玉。
一、詞典的形式與使用者
(一)采用在線詞典的形式
紙質詞典在學習者的外語學習過程中發揮著重要的作用,但是如果和電子詞典相較,其缺點也極為明顯:平面化、直線性、媒體形式單一。電子詞典以其方便、快捷、功能強大等優勢已經在國外占據了詞典市場的很大份額,而在線詞典更有望成為未來詞典的主流形式。電子詞典主要有三種形式:掌上詞典(例如文曲星、快譯通以及其他使用于PDA、手機上的詞典)、光盤詞典(如金山詞霸、Longman Dictionary of Contemporary English CD-ROM)以及在線詞典(如金山愛詞霸――http:///;n詞酷――http:///)。掌上詞典的優勢在于便攜、檢索迅速,但是目前可以看到的掌上漢語詞典也存在一些問題。
第一,詞典的質量不高,編者往往不是專業的詞典工作者,有些詞典只強調收詞量的多少,而對于詞語的難度、配例的多少、詞語的交際功能等缺乏考慮。第二,對詞典的使用對象一般都沒有明確的界定,缺乏針對性。第三,媒體形式簡單,往往只是紙質詞典的翻版,最多配上了發音。第四,屏幕一般較小,單屏顯示信息有限,查找常用詞(對于初學者來說至關重要)因為義項、例句較多要多次翻頁,較為不便。第五,國外出版商發行的詞典由于對目前漢語的使用情況缺乏了解,出現內容陳舊、語體混雜、釋義錯誤等現象,學生依據詞典對譯出來的漢語詞往往讓中國人不知所云。
相對而言,光盤詞典和在線詞典有更多的優勢。由于工作載體的原因,這樣的詞典容量大,功能強;詞語、信息檢索方式多,檢索速度快;可以運用多種媒體形式傳遞信息。電子詞典可以綜合運用語言、圖像、圖表、聲音、視頻等多種符號形式,立體地傳遞信息。而采用HTML語言編寫的軟件或者網頁具有支持多種數據形式、制作維護容易、鏈接集成功能強大等優勢,因此光盤或在線詞典有理由成為未來學習詞典的主要形式。光盤詞典因為制作周期、發行成本的限制,現在有很多也采用在線更新詞庫的方式來運營。最近幾年,無線網絡技術和無線上網便攜設備一直處于高速發展中,這無疑為在線詞典的生存、發展提供了最好的依托。目前為漢語學習者制作的光盤詞典或在線詞典還很少,僅有的一些也多是針對懂英語的學習者,針對其他語言背景的學習者制作的在線詞典還基本是一個空白。
(二)采用雙語的形式
第二語言學習詞典可以分為單語和雙語兩種形式,現在國內紙質的學習詞典多為單語形式,但我們認為針對初學者的在線詞典還是以雙語為宜。這是由漢語國際推廣的形勢決定的,目前漢語學習者大量增加,其中初學者占主體部分。學習者的起點普遍較低,學習時間大多不長,詞匯量較少。學習者更多的是想學習實際交際中可能使用到的漢語,更多的想學習口語表達,對讀、寫、譯往往沒有太高的要求。單語學習詞典往往層次較高,只盯著學習者中的“精英分子”,脫離了普通學習者的真正需要。而通過實際的調查來看,單語漢語學習詞典在學習者中的使用率不容樂觀。
如果從心理語言學的角度來看,第二語言初學者是根據詞匯聯結通路來學習單詞(不管其母語與目的語是否相似),第二語言中的詞匯在其意義被接受之前首先要被翻譯成母語的詞匯,隨著第二語言的熟練度不斷增加,第二語言的詞條才會逐漸與語義形成直接聯結,而不需要通過母語詞匯的中介,形成多通路模式。
因此我們認為針對初學者的在線詞典宜采用雙語的形式。這樣可以充分利用漢外對等詞來闡明漢語詞語的釋義,規避了用漢語解釋漢語詞義時可能帶來的詞義增值、詞義脫落或詞義轉移等現象,從而使初學者感到便利、省時。同時,詞典還應該把知識取向的重點放在漢外之間屬于差等對應或者空缺對應的那些詞語知識的部分。另外,詞典所有的漢語配例應該用外語進行對譯,詞語的語用環境以及文化意義應該用外語來進行解釋或描述。
(三)以用戶為中心
要想使詞典編纂人員的辛苦不至于白費,使詞典制作、發行的投資方不至于虧本,在詞典編寫之前對市場情況、用戶群做好充分的調查是十分必要的。針對市場方面的調查應該包括:詞典的總體需求量有多少,電子詞典的市場動向如何,同類產品(包括紙質詞典)在市場上有多少,占有多少市場份額,潛在用戶的人數有多少,對電子詞典的市場需求變化情況如何,產品的價格定位是多少,多長時間能收回成本,有沒有很好的銷售渠道,等等。
針對客戶(學習者)的調查主要包括:他們的身份、背景和經歷,他們學習漢語的需要、詞典查詢的內容、詞典查詢的習慣和所采用的查詢策略等,他們的態度、期望,等等。而隨著認知心理學的研究成果在語言教學中的應用,學習者查閱詞典的認知心理過程也逐漸引起研究者的注意。要使學習詞典滿足漢語學習的需要還必須弄清學習者查閱詞典的認知過程,包括解碼和編碼過程中的信息處理方法,以及心理詞庫知識的獲取模式等。
從這個意義上來說,目前市面上的漢語學習詞典在編纂、發行之前大多沒有做過這方面的調查,編纂者對市場情況以及學習者的使用偏好和實際需要大多不甚了解,這往往就造成了功能定位失當,讀者范圍不明確,準入門檻偏高,對讀者的詞典查詢策略考慮不周等等問題,致使詞典中出現了大量的“非共享信息或消極信息”,影響了詞典的可接受性。
二、在線詞典的宏觀結構與微觀結構
(一)詞典的宏觀結構
詞典的宏觀結構主要考察的是詞典的篇幅、價格、收詞量、詞目編排方式、版式、附錄設計等等。關于詞典的篇幅,因為采用的電子形式,特別是網絡形式,相對于傳統紙質詞典來說,空間幾乎是無限的,基本沒有篇幅上的限制。這種在線詞典在將進入市場的初期,可以采用開放注冊的方式;占有一定市場份額以后,改變為交費注冊使用,費用高低根據投資、類似產品定價以及市場情況來決定;有一定知名度,進入市場成熟期以后,可以考慮會員有償注冊制度,同時利用廣告費用沖抵成本,維持運營。在線漢語詞典的收詞量,取決于學習者總體水平和市場需求。目前階段,因為漢語學習者整體水平不高,其中初學者人數增加比較快,我們將收詞量暫定為5000左右,目前的設計主要針對韓國漢語初學者。其中包括《漢語水平詞匯與漢字等級大綱》中的甲級詞、乙級詞、部分丙級詞和一些目前常用而在《漢語水平詞匯與漢字等級大綱》甲乙丙級詞表中未見收錄的詞匯,例如“地鐵、手機、短信”等。另外,也要適當收錄學習者在運用漢語交際時可能遇到的常用新詞、新語或新義(如“網購、白領、曬工資、暈”)。對于所收詞語有多個義項的情況,要根據語料庫統計以及實際語言使用、教學的情況斟酌選取,有些不太常用的義項暫時不予收錄。收詞不應只限于詞匯性單位,還應包括語法性單位,如“看不起、怪不得、不客氣、炒魷魚”等等。詞目編排的方式主要包括以下兩個方面:第一,以單個漢字立目,在漢字下列出該字的常用成詞義項,對不能單獨成詞的詞素義項按成詞數量(重要性)來區別對待,不太重要的詞素義項不列出,成詞較多的義項列出韓語的翻譯以便學生理解。漢字后列出所有用該字組成的常用詞(正序、逆序),為每個詞語建立超鏈接。這樣做可以展現漢語的構詞特點,方便學生學習構詞方面的知識。第二,為詞典提供更多的檢索方式,在這方面電子(在線)詞典有其強大的技術優勢。除了傳統的筆畫、部首、拼音檢字以外,還可以采用按詞檢索(輸入一個詞語查找它的意思)、手寫輸入漢字(詞)檢索、語音識別檢索、模糊查詢(采用“*”、“?”作為通配符)、翻譯檢索(輸入外語詞語檢索漢語對譯詞)、按義類進行檢索等。為了方便學生的使用,甚至可以考慮將所有的例句建立一個例句庫,例句庫提供按字、詞、詞組、固定結構、句子的檢索方式。
(二)詞典的微觀結構
詞典的微觀結構主要指詞條的具體信息。可以大體分成4個板塊:常規板塊、搭配示例板塊、偏誤糾正板塊、語用文化板塊。
常規板塊主要是詞語的注音、釋義,其中釋義的部分以外語的對等詞翻譯為主,在出現差等對應(沒有完全對等詞)或空缺對應(完全沒有對等詞)的情況下,應該用簡單的漢語進行解釋,再用外語進行翻譯。其中漢語釋義的部分要求對釋義用詞的難度有所控制,釋義要求簡明、準確,這樣學習者可以借助外語的翻譯來理解漢語的釋義。有些詞語還可以考慮選用圖像、圖表、聲音、視頻等等多種信息來輔助釋義。
搭配示例板塊要用大量的例句來展示詞條的詞性、常見的搭配、在句子中的位置(語法功能)、常用的句式、適用的對象等等。如動詞的句法特征可以包括后接賓語、助詞、補語及重疊用法等等。而對于名詞來說最重要的就是要注出一般使用的量詞,列出常用的“形+名”、“名+名”、“動+名”搭配形式。詞語的種種用法都要求用例句來充分予以展示,作為例證的句子應該是規范的、常用的、內容健康的、完整度充足的、無文化因素干擾的基本句。例證要更多地考慮到句子在實際語言生活中的交際價值,考慮到句子所傳遞的種種附加信息,要讓學習者能在交際中遇到、使用這些句子,如“現在是紅燈,請不要闖紅燈”,這樣可以更好地了解當下的中國。有些詞語還可以考慮由例證提供完整的語境,以便學生通過上下文推知詞語的意義。比如在詞條“差點兒”下面的例證可以考慮提供以下語言環境:電影7點開演,一個人6點58分匆匆忙忙趕進電影院,同時說:“差點兒遲到。”由于是電子詞典,這樣的語境展示可以采用動漫(或視頻)的形式而不需要用文字進行描述,學習者對詞語的理解將更為準確。
偏誤糾正板塊要求針對學習者使用漢語的實際情況,指出他們常犯的詞匯、語法錯誤。出現詞語使用上的偏誤也常常和近義詞的誤用相關,所以關于近義詞的辨析也可以放到這個部分。例如針對韓國學習者的詞典在詞語辨析方面,既要傳承詞義、詞性、搭配等約定俗成的學習內容,也要特別考慮韓語里的漢字詞和漢語對應詞在語義范圍(如韓語里有漢字詞“文章”,意思相當于漢語的“句子”)、義項多寡(如韓語里的漢字詞“氣氛”除了有漢語里相應意思以外,還有“心情”、“情緒”的意思)、附加色彩(如漢字詞“可觀”有表示“可怕的景觀”的貶義)等方面的不同。這個部分的編寫特別要求有精通兩種語言的雙語研究人員的參與,另外還要有學習者的漢語語料庫作為支撐。
語用文化板塊里主要列出詞語的語用信息和文化意義。目前將漢語作為外語來進行學習的人大多是成年人,他們學習漢語的目的就是為了交際運用,我們的學習詞典在解惑的同時更要重視指導語言交際運用的實用性。除了詞典的配例部分要體現交際價值,還可以為有些詞語特別添加語用內容。比如為稱呼語添加語用信息,由于時代的變化,有些稱呼語的意思已經和傳統詞典上的意思差別很大(例如“小姐”、“同志”),如果不添加語用信息予以指出,學生難免誤用。再比如為一些副詞添加語用信息,例如“老”常用于表達批評,“有點兒”常用于表達抱怨,“差點兒”常用于表達慶幸,這樣的語用信息予以指出以后,學生可以更好地理解和運用。另外,還可以在一些詞語下面增加話題層面的語用信息,例如在“感謝”一詞下面列出常用的表達感謝的方式,在“年齡”一詞下面列出詢問年齡的方式等等。
三、在線詞典的新特色
(一)有利于充分建立學習者的詞匯語義網絡
從詞匯語義學的角度來看,詞語的意義是由詞語和語言中其他詞語的關系來決定的。根據語義場理論,同一語義場里的各個詞語彼此之間在語義上是互相依賴的。只有在組合和聚合的關系中才能更清楚地認識詞的意義。詞語學習的過程不但是個形式與意義建立聯系的過程,更是一個建立語義網絡的過程,在這樣的語義網絡中,詞語和信息的組織形式使它們可以很容易地被激活(喚醒)。第二語言詞典應當注意揭示詞語之間的關系,在詞條之間建立組織良好的語義網絡。詞典中按音序或形序方式排列的詞條與語言的本質以及語言的習得是互不相容的。
我們認為,學習外語者也有第二語言的心理詞庫,在心理詞庫建立的早期階段,第二語言通過第一語言(母語)和概念相聯系,第二語言心理詞庫中詞語間的語音(詞形)聯系很重要。進入了第二語言的熟練階段以后,第二語言直接和概念建立聯系,第二語言的心理詞庫中詞語間語義上的聯系更為重要。如果在語言學習的開始階段就在詞典中系統地提供第二語言詞語之間的語義聯系,對學習者語言熟練性的提高無疑是有好處的。而且,由于詞語的意義總是和其他詞語高度聯系起來的,有一定詞語語義網絡的雙語詞典可以加強學習者對第一語言和第二語言語義差別的認識。
在線詞典中為詞條列出有各種語義關聯的詞語,這些語義關系包括同義、反義、類義、對義(如“丈夫”相對于“妻子”)等;同時我們為詞條列出因為語義關系而常常共現的詞語(例如“飯店”和“客人、服務員、菜單、筷子”等)。我們在例證中盡量使這些詞語能充分展示,再給所有的詞語都建立超鏈接以便學習者查看。這樣建立起一個詞語的語義網絡,對學習者的詞匯學習來說無疑有很大的幫助。在建立這種語義網絡時,HTML語言是最為有效的。
(二)有利于幫助學習者記憶詞語
現有的詞典(紙質的或者電子的)在如何幫助學習者記憶詞語方面很少有什么好辦法,在這里我們可以設想在線詞典一些幫助記憶詞語的工作方式。例如我們可以給漢字提供字源形式,幫助學習者記憶漢字的意思,以便記憶詞語的意義;也可以提供一些詞語的詞源(造詞方式),幫助學生理解詞語,達到記憶的目的。再如我們可以學習一些英語學習詞典的做法,在在線詞典內增加主題頁面,將當今流行的主題詞匯以及日常生活中常用的詞匯分類歸納在一起,配以插圖和例句,以便學習者更直觀更輕松地掌握相關詞匯。還有我們可以在學生每次登錄時都將上次查詢過的生詞及其意義、用法簡單地列出,便于學生回憶。另外,我們還將增加詞匯測試的內容,或者以游戲的形式幫助回憶單詞。
參考文獻:
〔1〕蔡永強.《當代漢語學習詞典》配例分析[J].辭書研究,2008(3).
〔2〕高立群,孟凌,劉兆靜.日本留學生心理詞典表征結構的實驗研究[J].當代語言學,2003(2).
〔3〕侯明.編纂簡明漢語單語系列學習詞典的構想[J].語言與翻譯,2009(1).
〔4〕金曉陽.影響對外漢語學習詞典信息可接受性的因素――析《現代漢語學習詞典》的不足[J].辭書研究,2004(4).
〔5〕陸谷孫,王馥芳.當代英美詞典編纂五十年綜述[J].外語教學與研究,2006(2).
〔6〕孫全洲.談談學習型漢英詞典的編寫問題[J].辭書研究,1990(4).
句子翻譯在線范文6
【關鍵詞】課堂教學 英語語料庫 翻譯
1.引言
近幾十年來,英語語料庫(Corpus)的研究和創建取得了巨大的進展,國內外出現了眾多各種類型的英語語料庫。在英語教學與研究方面,語料庫一直發揮著非常重要的作用,從理論、內容和方法等方面對語言教學與研究都有重要影響。語料庫是專門用于語言材料檢索和統計的工具,是由大量收集的書面語構成,并通過計算機儲存和處理,其最大的特點是能快速提供大量真實的語言材料并進行相關統計。
語料庫的開發與建設,給外語教學與研究帶來新的變化。在英語翻譯課堂中,同樣可以有效地利用語料庫,目前涌現出大量研究雙語平行語料庫的語料庫都可以有所借鑒。在從事教學過程中筆者發現,將母語直譯成目標語沒有問題,但目標語語感不足或語感誤差導致的用詞錯誤或因譯者外語水平不同而導致詞語有著不同程度的錯誤存在形式,詞典、教材、語法書從某種程度上而言作用欠缺,因此本文嘗試性探討在英語翻譯課堂上,以目標語語料庫為輔助的方法來授業解惑。
2.以語料庫為輔助的漢譯英詞語翻譯方式
除了為詞典的編撰提供服務外,語料庫的發展也為外語教學提供了豐富的資源和廣闊的發展前景。語料庫中有大量真實語境意義的實例,以數據或語境共現的形式呈現在學習者面前,有利于強化記憶以及幫助學習者利用語境獲取語義和總結規律的學習環境。
本文涉及漢譯英實踐所使用的語料庫均來自英語國家語料庫(British National Corpus,簡稱BNC)和Cobuild以及 LDC(Linguistic Data Consortium)。語料庫在線檢索在日常英語課堂教學中最常見的用途是提供大量典型語例供大家對比參考。
2.1 用于詞語的詞義的褒貶以及詞語的語體色彩
在漢譯英過程中,能否根據上下文準確翻譯出詞義的感彩至關重要,不同的詞語出現在不同的語體中,帶有不同的語體色彩,很多情況下,借助于翻譯詞典等工具得不到很好的效果,此時參照語料庫中的語料不失為好的方法。
我們知道,翻譯語句不僅要注意詞語的感彩,同時更要注意他們的語體色彩,以便忠于原作者的觀點。下面一則例句就是學生們在翻譯過程中,成功借助語料庫數據的幫助較好地完成了翻譯任務,而且注意了詞語的語體色彩。
例句:在這場金融危機中,我們一直講社會主義,而他們一直講資本主義。
對于 “講”這個字,詞典中給出的英文單詞為preach和advocate,到底哪個講用preach,哪個講用advocate,如何使用才能真實而精準地反映出作者的世界觀的態度,通過語料庫中對兩個單詞的檢索,得到以下預料數據:
Extremists, defined here as intellectuals imbued with (foreign) revolutionary thought, preach violence and terrorism, against which the steadfastness of labour must prevail
Danielwas also a strong advocate for the application of DUL , although he understood the peculiar difficulties of nation-wide utilities in this respect.
We shall make the widening of the Community a priority, and shall advocate speedy admission for Austria, Sweden, Finland and Cyprus, whose membership applications have been or are about to be lodged.
對比分析,preach更多含有鼓動、鼓吹之意,貶義色彩極濃,而preach實則為一種積極奮發向上的宣揚、宣講。根據作者的態度,我們將此句譯為:
We advocate socialism whereas they preach capitalism .
2.2 用于同義詞辨析及搭配詞的使用
2008年5月12日,四川省北川遭受了一場巨大的地震,詞語:“巨大的地震”,字典中給出很多單詞, huge , great ,deadly ,devastating .
在China Daily中,我們截選出這樣的句子:
The 2008 Sichuan earthquakeor the Great Sichuan Earthquake was a deadly earthquake that occurred on May 12, 2008 in Sichuan province of China.
huge , great ,deadly都含程度大之意,然其語氣程度較弱于地震的毀滅性,于是把單詞 devastating放到語料庫上進行搜索,得出以下例句:
Chinese President Hu Jintao led the charge Monday, ordering ”all out efforts to help those affected” by the devastating earthquake”.
中國國務院總理在英國劍橋大學發表的演講辭中也有這么一句話,Sichuan Province after the devastating earthquake there last May shocked the whole world.
毫無疑問,巨大的地震用devastating earthquake 表達更為貼切。
2.3 用于詞性轉換和正確造詞
漢譯英的過程中,多數情況是把漢語動詞轉換為英語名詞,然有時為了鮮活文章,也會把漢語名詞轉換成英語動詞,相應句中其他詞性也應發生轉換。
例一、一堂講授在中俄建交60周年慶祝大會的演講的中文稿中,給出的句子:
總書記的演講給我們留下了深刻的印象。
句中名詞可以轉換成動詞的是:“印象”,字典里給出了英文單詞: impression ,如果直譯就是leave us a deeply impression , 語氣極為平淡,通過語料庫中impression的搜索,發現了另一個單詞:impressed :
Lewis does present in his Preface to 'Paradise Lost'a very convincing impression of having read the poem which John Milton set out to write and meant us to read.
He was always impressed with Leonard's room, which he found to resemble more a study than a youth's bedroom - already the style was evident.
通過檢索內容我們可以看出,使用impressed更能傳達作者的心情,因此,譯句為:
His lecture at the Conference Marking the 60th Anniversary of Diplomatic Relations Between China and Russia impressed me deeply.
由此我們發現只有一個單詞具備名詞和動詞兩種詞性時才可轉換使用,生造詞語則會引起句子歧義。
例二、一堂講授溫總理在英國劍橋大學發表演講的文稿中,給出的句子:
我們仍然是一個發展中國家:人口多,底子薄,發展不平衡, 細看形容詞:多,薄,不平衡,字典中“多”的英文有:more , big, large , lots of 等,“薄”在字典中給出: thin , weak,lack of 等意思,“不平衡”給出了unfair , imbalance , inequality三個意思 ,如果直譯即為lots of people 、lack of money and imbalanced development.顯然這屬于生造詞語,不符合翻譯的原則,當我們對所有形容詞進行搜索 :
Clearly the easily accessible position of the Malvern's near big population centers makes them a popular target for picnickers and day trippers.
The former though, brought out once again the weak foundation in national policy for any large-scale resettlement of the long-stay population.
Uneven development has always characterized economic activity in Britain and elsewhere.
從搜索到的語料數據來看,“多”用big ,“薄”用weak,“不平衡”用 Uneven。
因此,譯句為There has been no fundamental change in our basic national condition: a big population, weak economic foundation and uneven development.
3、小結
隨著信息時代的到來,基于語料庫的研究方法會越來越受到老師們的青睞,基于語料庫的研究對教師的教學能夠產生非常積極的影響,語料庫應用于翻譯的教學中除了直接影響到教學內容的擴展性,同時對翻譯教學的思想和方法有著很好的指導意義。
在以語料庫為輔助方式的教學中,教師很容易找到大量精準而生動的例句給學生,幫助他們理解詞語在實際應用中的意義和用法,同時,通過檢索大量的語言信息,學生會逐步養成探索型的學習習慣,這種以學生為中心的教學模式將引導學生成為獨立的學習者,這也是教與學的最大意義所在。
參考資料:
[1]何安平. 談語料庫語言學應用的新發展. 外國語, 2001, (2).
[2]潘盤、馮躍進. 語料庫浯言學與外語教學思想的轉變. 外語學刊, 2000, (4).
[3]文渤燕. 語料庫及其作用. 國外外語教學, 2001, (2).
[4]楊惠中:《語料庫語言學導論》,上海外語教育出版社,2002.
[5]王東風英漢詞語翻譯中的義素對比分析 《現代外語》1997.(1) .
[6]胡顯耀基于語料庫的漢語翻譯小說詞語特征研究 《外語教學與研究》2007.(3).
[7]陳 偉翻譯英語語料庫與基于翻譯英語語料庫的描述性翻譯研究 《外國語》2007.(1).
[8]Chen, S. Q. A study of communication strategies in interlanguage production by Chinese EFL learners[J]. Language Learning, 1990, 40(2):155-187.