語言服務行業創新技術研究

前言:尋找寫作靈感?中文期刊網用心挑選的語言服務行業創新技術研究,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

語言服務行業創新技術研究

摘要:人工智能技術的興起給語言服務行業的發展帶來了新挑戰。旨在分析人工智能背景下的語言服務行業發展趨勢,在結合國內外語言服務需求的基礎上,對語言服務中的創新技術應用和策略進行研究,尋找有效的互聯網翻譯技術及語言服務解決方案,推進大數據、人工智能與語言服務的協同創新發展。

關鍵詞:人工智能;語言服務;翻譯技術;語音識別

1語言服務行業發展趨勢

隨著社會語言服務需求的不斷增長,人們對語言服務行業發展的研究不僅包含國家層面上的總體戰略規劃,并且逐漸開始向社會層面的各專業和業務領域深度發展研究延伸。語言服務行業涉及翻譯服務、本地化服務、語言技術工具開發與應用(機器翻譯MT與計算機輔助翻譯CAT)、語言教學與培訓等眾多業務領域。人工智能語言服務的出現,突顯了全球化大數據背景下的語言信息特點以及翻譯智能技術平臺時代的來臨,未來即將是“一帶一路”的專業化語言服務和智能化翻譯需求激增的時代。目前國內語言服務行業的發展趨勢和現狀是:語言服務人才市場供求失衡,語言服務人才培養體系不完善,翻譯技術和軟件運用不足,語言類服務企業和高校的創新協同合作有待深入,網絡翻譯平臺的開發與應用研究需要新技術和新實踐等。

2人工智能技術背景下的語言服務需求

知識增長和技術發展往往呈現交替加速發展的特點,當今尤其以云計算、大數據、人工智能、物聯網、5G等為代表的新技術正逐漸改變著人類生活的各個領域。人工智能技術正改變著智能制造、金融貿易、教育培訓、公共事業、醫療應用等各個行業,并成為變革社會的重要推動力。世界各國都高度重視發展人工智能,加強人工智能領域的技術研發和創新。2017年國務院的《新一代人工智能發展規劃》將發展人工智能作為國家重點發展戰略之一。2018年教育部印發的《高等學校人工智能創新行動計劃》中指出要加快人工智能在教育領域的創新應用。人工智能的應用開始涉及各行各業。目前,中國的人工智能在金融、安防、客服等行業領域已得到廣泛運用。人工智能在語言服務行業的應用主要是自然語言處理技術(NLP),它是計算機科學、人工智能、語言學關注計算機和人類(自然)語言之間的相互作用的領域,主要包括機器翻譯和語音識別技術。機器學習、語音識別、語義識別、圖像識別技術等不同形態的語言產品將不同程度地融入新的智能技術平臺,未來語言服務業的發展無疑會進入“語言智能+”的時代。語言智能的目標是實現自然語言與機器語言的連續交互,是人工智能的高級階段,在未來人工智能的應用上有著非常重要的作用。

3語言服務行業技術應用與創新

3.1翻譯技術的應用。人工智能翻譯技術的應用在語言服務業中發揮著越來越重要的作用。傳統的簡單機械的人工翻譯模式已經無法適應快速發展的市場需求,今后會逐漸被機器翻譯、語音識別技術和同步多語字幕翻譯技術、神經網絡機器翻譯技術所取代。在新一代技術的影響下,翻譯產品也發生著巨大的變化。2018年底由騰訊AILab研制出的人工智能輔助翻譯產品TranSmart在業內引起轟動。騰訊交互翻譯TranSmart是一款面向人工翻譯場景的機器翻譯產品,也是業內首個落地的交互式機器翻譯產品。該產品結合了騰訊AILab自主研發的神經網絡機器翻譯、交互式機器翻譯、翻譯輸入法、翻譯記憶片斷復用技術,配合億級雙語數據,幫助用戶更快、更好地完成翻譯任務。針對人工翻譯市場現狀,特別加強了常見專業領域的翻譯性能,對于教育、合同、法律和專利等領域的文本效果尤為出色。另外,針對2020年初的突發性全球肺炎疫情,很多語言服務行業人士運用自己的語言技能,服務于抗疫戰役,將中國寶貴的抗疫經驗通過多國文字及時地傳遞給全世界,讓更多的人能夠積極參與防疫抗疫。一個機器翻譯矩陣Tmxmall為了給更多正在為抗疫出力的翻譯團隊及相關人士提供技術便利,及時上線了聚焦于醫療的垂直領域機器翻譯引擎——阿里醫療機器翻譯。阿里醫療引擎是阿里云達摩院機器翻譯產品,能為譯者提供更加專業和準確的醫療翻譯結果。該系統支持中英、英中、中日、日中及多語種互譯,并且支持YICAT企業版/團隊版、TmxmallMTPlugin、SDLTrados、memoQ中應用。本次疫情期間,阿里也在不間斷地使用優質的疫情雙語語料來訓練醫療機器翻譯引擎,幫助大家更加輕松高效地完成肺炎疫情及醫療相關的翻譯工作。未來,翻譯服務也將從通用領域的機器翻譯:谷歌翻譯、有道翻譯、云譯、騰訊翻譯君、搜狗翻譯、aws、阿里翻譯、小牛翻譯、DeepL、百度翻譯、Bling、Yandex等,拓展到更精準更專業化方向的垂直領域機器翻譯。未來幾年,智能化的翻譯技術必將加速推進語言服務行業的發展。人工智能背景下的語言服務必將是專業領域和業務領域深度融合發展的語言服務。

3.2語音識別技術的運用。語音識別作為自然語言處理的關鍵技術,被逐漸運用于移動終端,各種語音識別產品層出不窮。語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別人類口述的語言。本次研究以大數據采集、抽取樣本的研究方法研究語音識別技術的創新應用。以杭州好云教育科技有限公司提供的MyET語音識別軟件在浙江省高?;ヂ摼W聽說比賽系統中的運用為實證研究,以大數據評價學生學習習慣的養成和在實踐過程中口語能力的變化情況。MyET自動語音分析診斷技術(ASAS©,AutomaticSpeechAnalysisSystem),擁有中國、英國、法國、德國、日本等九個國家及地區的發明專利(中華人民共和國專利第ZL02160031.7)。系統會根據語言學習四個要素——發音、語調、流利度、音量去分析學習者在口語上的問題,并提出有效的口語改善建議。比賽收集的數據和報表包括以下幾種。詳細成績報表(ScoreDetails)數據內容:在比賽期間中,系統會完整詳實記錄選手歷次進行比賽刷分的信息,包含每次比賽刷分成績、比賽刷分次數、登錄比賽刷分時間點及每次完成比賽所花的時間。數據意義為教師可以從詳盡的成績數據中,了解每一位學生對大賽的投入程度,并看出學生在大賽實踐過程中口語能力(成績)的變化。統計報表(Statistics1)比賽總時長(ContestDuration)數據內容:在比賽期間中,系統會自動偵測每位選手每次進入比賽與完成比賽當中實際操作所花的時間,計算出選手實際投入在比賽模塊的總在線時間。數據意義為教師可以了解每位學生總共花了多少時間在進行比賽,看出通過大賽是否能有效激發學生的學習熱情,啟發學習的積極主動性。課程學時長(AccumulatedLearningTime)數據內容:每位參賽選手將獲得一組MyET課程包,選手可在比賽期間進行課程練習,系統會自動偵測并計算每位選手使用課程內各學習模塊(包含單句練習、角色扮演、強化練習、自我檢定、跟讀、復誦等)進行自主學習的總體時間。數據意義為教師可以了解每位學生在課堂外,花了多少時間在進行口語課程的自主學習,有效增加了多少口語學時。以學校為單位的分析報表(Analysisbyschool)數據內容:在比賽期間中,同一場比賽里,報表會呈現每所參賽學校的總參賽人數、每所學校參賽選手總刷分次數、每所學校參賽選手總刷分時間。數據意義為教師可以了解在比賽中,各學校對比賽投入程度及自己學校的學生在比賽的總體表現程度。刷分時段分析報表(AnalysisbyTimeSlots)數據內容:在比賽期間中,報表會呈現全體選手刷分時段的分布統計。數據意義為教師可以了解學生上線時間分布,看出學生習慣在哪些時間段內學習,體現通過大賽是否有效地幫助學生養成學習習慣及妥善運用碎片化時間學習。在人工智能語言服務改變人類經濟社會生活方式的新形勢下,抓住機遇,努力進行技術創新變革,逐步建立語言服務行業規范及標準,培養新一代創新技術應用人才是當前語言服務行業發展的當務之急。

參考文獻:

[1]蔡自興.人工智能及其應用[M].北京:清華大學出版社,2016.

[2]羅華珍,潘正芹,易永忠.人工智能翻譯的發展現狀與前景分析[J].電子世界,2017(21):21-23.

[3]王華樹.語言服務的協同創新與規范發展——2016中國語言服務業大會暨中國譯協年會綜述[J].中國翻譯,2017(1):85-88.

[4]2016中國語言服務行業發展報告[R].中國翻譯協會,2016.

作者:湯麗拿 單位:浙江長征職業技術學院

亚洲精品一二三区-久久