3月14日,微軟宣布,其研發(fā)的機器翻譯系統(tǒng),在通用新聞報道測試集newstest2017的中英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報道的翻譯質(zhì)量和準確率上可比肩人工翻譯的翻譯系統(tǒng)。
為了確保翻譯結(jié)果準確且達到人類的翻譯水平,微軟研究團隊邀請了雙語語言顧問,將微軟機翻結(jié)果與兩個不同的人工翻譯結(jié)果進行比較。
微軟技術(shù)院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,這是對自然語言處理領(lǐng)域最具挑戰(zhàn)性任務的一項重大突破。“在機器翻譯方面達到與人類相同的水平是所有人的夢想,我們沒有想到這么快就能實現(xiàn)?!彼硎荆跋Z言障礙,幫助人們更好地溝通,這非常有意義,值得我們多年來為此付出的努力?!?/P>
微軟技術(shù)院士黃學東
機器翻譯是科研人員攻堅了數(shù)十年的研究領(lǐng)域,曾經(jīng)很多人都認為機器翻譯根本不可能達到人類翻譯的水平。盡管此次突破意義非凡,但這仍不代表人類已經(jīng)完全解決了機器翻譯的問題,只能說離終極目標又近了一步。
微軟機器翻譯團隊研究經(jīng)理Arul Menezes解釋:當一種語言(比如中-英)擁有較多的訓練數(shù)據(jù),且翻譯的是常見的大眾類新聞詞匯時,人工智能加持下的機器翻譯表現(xiàn)可以與人類媲美。
近兩年來,深度神經(jīng)網(wǎng)絡(luò)的使用讓機器翻譯的表現(xiàn)取得了實質(zhì)性突破。相較于以往,機器翻譯結(jié)果變得更加自然流暢。
微軟將他們的最新研究成果——對偶學習(Dual Learning)和推敲網(wǎng)絡(luò)(Deliberation Networks)應用在了此次取得突破的機器翻譯系統(tǒng)中。微軟亞洲研究院副院長、機器學習組負責人劉鐵巖介紹道,“這兩個技術(shù)的研究靈感其實都來自于我們?nèi)祟惖淖鍪路绞??!?/P>
其中,對偶學習使得中文句子翻譯成英文之后,系統(tǒng)會將相應的英文結(jié)果再翻譯回中文,并與原始的中文句子進行比對。從這個比對中,機器會學習有用的反饋信息,對翻譯模型進行修正。
推敲網(wǎng)絡(luò)則類似于人們寫文章時不斷推敲、修改的過程。通過多輪翻譯,不斷地檢查、完善翻譯的結(jié)果,從而使翻譯質(zhì)量得到大幅提升。
微軟亞洲研究院副院長、機器學習組負責人劉鐵巖
周明帶領(lǐng)的自然語言計算組,多年來一直致力于攻克機器翻譯——這一自然語言處理領(lǐng)域最具挑戰(zhàn)性的研究任務?!胺g沒有唯一的標準答案,它更像是一種藝術(shù),因此需要更加復雜的算法和系統(tǒng)去應對?!敝苊鞅硎尽?/P>
此次newstest2017新聞報道測試集,包括約2000個句子,由專業(yè)人員從報紙樣本翻譯而來。微軟團隊每次會隨機挑選數(shù)百個句子翻譯。
為了驗證機器翻譯是否可以媲美人類翻譯,測試經(jīng)歷了極為復雜的驗證過程。這是因為,沒有所謂“正確的”翻譯結(jié)果,即使是兩位專業(yè)的翻譯人員,對同一個句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。表達同一個句子的“正確的”方法不止一種。
周明解釋:“這也是為什么機器翻譯比單純的語音識別復雜得多,人們可能用不同的詞語來表達完全相同的意思,但未必能準確判斷哪一個更好?!?/P>
相比之下,判斷語音識別能否媲美人類則相當簡單:標準答案是唯一的。
這種沒有標準答案的任務,使得機器翻譯成為一個極有挑戰(zhàn)、同時極富意義的問題。劉鐵巖表示,我們不知道哪一天,機器翻譯才能在面臨任何語種、任何類型的文本時,都能在“信、達、雅”上媲美專業(yè)翻譯人員的水準。但總體而言,他對技術(shù)的進展表示樂觀,因為整個學術(shù)界在持續(xù)發(fā)明大量的新技術(shù)、新模型和新算法,
“我們可以預測的是,新技術(shù)的應用一定會讓機器翻譯的結(jié)果日臻完善?!蔽④泩F隊還表示,此次技術(shù)突破將被應用到微軟的商用多語言翻譯系統(tǒng)產(chǎn)品中。
2025-07-22 09:19
2025-07-21 09:06
2025-07-20 08:50
2025-07-20 08:39
2025-07-18 09:10
2025-07-15 09:36
2025-07-13 08:53
2025-07-13 08:49
2025-07-12 09:17
2025-07-10 15:24