機(jī)器翻譯終將攻克!微軟中-英新聞翻譯系統(tǒng)達(dá)到專業(yè)譯者水平

高層速讀

關(guān)鍵信息:微軟亞洲研究院宣布開發(fā)出第一個機(jī)器翻譯系統(tǒng),該系統(tǒng)在通用新聞報道測試集newstest2017的中-英測試集上達(dá)到了人類水平,在自然語言處理上,實現(xiàn)了媲美人類專業(yè)譯者的里程碑式突破。

機(jī)器翻譯終將攻克!微軟中-英新聞翻譯系統(tǒng)達(dá)到專業(yè)譯者水平

由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團(tuán)隊周三宣布,他們已經(jīng)開發(fā)出了第一個機(jī)器翻譯系統(tǒng),該系統(tǒng)在通用新聞報道測試集newstest2017的中-英測試集上達(dá)到了人類水平。當(dāng)100分是標(biāo)準(zhǔn)滿分時,微軟的系統(tǒng)得分69.9,專業(yè)譯者68.6。

微軟表示,他們對來自各種在線報紙的大約2000個句子樣本進(jìn)行了反復(fù)測試,并將測試結(jié)果與機(jī)器翻譯的結(jié)果進(jìn)行了比較,甚至聘請了雙語語言顧問,以進(jìn)一步驗證機(jī)器翻譯的準(zhǔn)確性。

首個媲美人類專業(yè)譯者的里程碑式突破

這個名為newstest 2017的數(shù)據(jù)集是去年秋天在WMT 17的研究會議上發(fā)布的,由專業(yè)人員從在線報紙樣本翻譯而來,因此,研究人員能夠如此迅速地達(dá)到這一成果,可以說是機(jī)器翻譯領(lǐng)域的里程碑,特別是機(jī)器翻譯是人們幾十年來一直試圖解決的問題。微軟指出,許多人甚至認(rèn)為,機(jī)器翻譯與人類水平相同的目標(biāo)永遠(yuǎn)不會實現(xiàn)。

黃學(xué)東院士在微軟的博文中表示:“在機(jī)器翻譯任務(wù)中,實現(xiàn)人與人之間的平等是我們所有人的夢想,我們只是沒想到這么快就能成功?!蓖瑫r研究人員也提醒大家,這并不代表人類已經(jīng)完全解決了機(jī)器翻譯的問題,只能說明我們離終極目標(biāo)又更近了一步。

機(jī)器翻譯終將攻克!微軟中-英新聞翻譯系統(tǒng)達(dá)到專業(yè)譯者水平

▲黃學(xué)東,微軟技術(shù)院士,負(fù)責(zé)自然語言和機(jī)器翻譯工作

近年來,人工智能和語音識別技術(shù)的進(jìn)步使得語音助理能夠進(jìn)入我們的手機(jī)和家庭,幫助消費者完成日常的計算任務(wù),控制智能家居設(shè)備,以及聊天和娛樂。但是,對網(wǎng)頁或新聞文章進(jìn)行機(jī)器翻譯,仍然會造成難以理解的語言上的混亂。因為機(jī)器翻譯最多能準(zhǔn)確翻譯字面意思,但幾乎不可能用任何深刻的語言來供你深入理解文章。要想真正理解長篇文章,你需要人的幫助。

但,即使是不同的譯者,翻譯一個句子的方式也可能略有不同,你不能說兩者誰對誰錯。“機(jī)器翻譯要比單純的模式識別任務(wù)復(fù)雜得多”微軟亞洲副院長、從事該項目的自然語言處理小組負(fù)責(zé)人周明說,“人們可以用不同的詞來表達(dá)完全相同的東西,但你不一定能說哪個更好?!?/strong>

機(jī)器翻譯終將攻克!微軟中-英新聞翻譯系統(tǒng)達(dá)到專業(yè)譯者水平

微信搜索【AI商業(yè)報道】,獲取國內(nèi)外AI巨頭新動向及行業(yè)資訊!

深度神經(jīng)網(wǎng)絡(luò)使翻譯更加流暢、自然

微軟還指出,人工智能的最新技術(shù)——深度神經(jīng)網(wǎng)絡(luò),為研究人員實現(xiàn)了這一突破做出了貢獻(xiàn)。深層神經(jīng)網(wǎng)絡(luò)是一種訓(xùn)練人工智能系統(tǒng)的方法,使研究人員能夠創(chuàng)造出更流暢、更自然的翻譯??紤]到更廣泛的使用場景,以前的方法稱為統(tǒng)計機(jī)器翻譯。

微軟的研究人員在系統(tǒng)中添加了自己的訓(xùn)練方法,以提高系統(tǒng)的準(zhǔn)確性,這相當(dāng)于人們一次又一次地檢查自己的翻譯作業(yè),以確保它是正確的。

周明表示,“由于翻譯沒有唯一的標(biāo)準(zhǔn)答案,它更像是一種藝術(shù),因此需要更加復(fù)雜的算法和系統(tǒng)去應(yīng)對?!弊匀徽Z言計算組基于之前的研究積累,在此次的系統(tǒng)模型中增加了另外兩項新技術(shù):聯(lián)合訓(xùn)練(Joint Training)和一致性規(guī)范(Agreement Regularization),以提高翻譯的準(zhǔn)確性。

聯(lián)合訓(xùn)練可以理解為用迭代的方式去改進(jìn)翻譯系統(tǒng),用中英翻譯的句子對去補充反向翻譯系統(tǒng)的訓(xùn)練數(shù)據(jù)集,同樣的過程也可以反向進(jìn)行。一致性規(guī)范則讓翻譯可以從左到右進(jìn)行,也可以從右到左進(jìn)行,最終讓兩個過程生成一致的翻譯結(jié)果。

機(jī)器翻譯終將攻克!微軟中-英新聞翻譯系統(tǒng)達(dá)到專業(yè)譯者水平

▲微軟中-英翻譯系統(tǒng)試用界面

這一機(jī)器翻譯研究成果可以應(yīng)用到人工智能的各個領(lǐng)域中”周明說。此外,它今后還將能夠準(zhǔn)確、自然地翻譯其他語言,同時應(yīng)用到微軟的商用多語言翻譯系統(tǒng)產(chǎn)品中。

除了微軟,谷歌的研究人員也一直在致力于機(jī)器翻譯,包括使用神經(jīng)網(wǎng)絡(luò)的中英文查詢機(jī)器學(xué)習(xí)技術(shù)。這些技術(shù)已經(jīng)被用于改進(jìn)谷歌面向消費者的產(chǎn)品中,比如谷歌翻譯的App,以及谷歌搜索。

微信搜索【AI商業(yè)報道】,獲取國內(nèi)外AI巨頭新動向及行業(yè)資訊!

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-03-15
機(jī)器翻譯終將攻克!微軟中-英新聞翻譯系統(tǒng)達(dá)到專業(yè)譯者水平
高層速讀關(guān)鍵信息:微軟亞洲研究院宣布開發(fā)出第一個機(jī)器翻譯系統(tǒng)。由專業(yè)人員從在線報紙樣本翻譯而來,因此,研究人員能夠如此迅速地達(dá)到這一成果,可以說是機(jī)器翻譯領(lǐng)域的里程碑。

長按掃碼 閱讀全文