搜狗王小川:2020年 機器翻譯的某些指標可以趕上人類翻譯

北京時間5月20日,2018全球人工智能技術大會(GAITC)在北京召開。作為中國人工智能技術和產(chǎn)業(yè)領域規(guī)模最大、影響力最強的專業(yè)會議之一,GAITC邀請到了中國工程院院士李德毅、圖靈獎得主姚期智、歐洲科學院院士漢斯·烏思克爾特等數(shù)十位業(yè)界專家,共同獻上了數(shù)場精妙絕倫的主題演講和對話。搜狗CEO王小川應邀在活動上發(fā)表了主題為《語言AI之路與挑戰(zhàn)》的演講。他回顧了人工智能在語言領域取得的進展,并指出“到2020年,機器翻譯在一些指標上可以趕上人類翻譯。”

搜狗王小川:2020年 機器翻譯的某些指標可以趕上人類翻譯

作為國內(nèi)用戶量第四大的互聯(lián)網(wǎng)公司,搜狗多款產(chǎn)品獲得了市場的認可,搜狗輸入法市場占有率多年保持第一的位置,搜狗搜索引擎市場份額為中國第二?;谠谡Z言領域積累的海量數(shù)據(jù)和領先能力,搜狗率先布局了以語言為核心的人工智能戰(zhàn)略。

從軟件到硬件,搜狗讓AI技術能夠融入每個人的生活,構建起翻譯、問答、輔助對話等使用場景。

搜狗翻譯:讓華語世界連接全世界

翻譯是搜狗近兩年來著力發(fā)展的方向。搜狗CEO王小川介紹道:“搜狗機器翻譯是以搜狗獨創(chuàng)的基于神經(jīng)網(wǎng)絡的機器翻譯技術為算法;同時,憑借搜狗輸入法、搜狗搜索引擎多年用戶使用積累,產(chǎn)生了豐富語料供AI自主學習。”經(jīng)過大量的訓練和積累后,搜狗神經(jīng)網(wǎng)絡機器翻譯的準確率愈發(fā)提高,屢獲國際大獎。在國際學術賽事WMT 2017中,獲中譯英系統(tǒng)八項機器評價指標中的七項第一。

神經(jīng)網(wǎng)絡機器翻譯技術,目前已經(jīng)在搜狗的核心產(chǎn)品中進行應用:搜狗輸入法上線翻譯功能,用戶可在聊天場景中進行中、英、日、韓等語言的翻譯;搜狗搜索中的英文搜索頻道,可以幫助用戶用英文搜索全世界。此外,搜狗還上線了翻譯App,幫助有專業(yè)需求的用戶進行聲音、圖片和文字的翻譯。

2018年,搜狗的兩款智能硬件——旅行翻譯寶、錄音翻譯筆正式發(fā)售。這兩款產(chǎn)品是搜狗神經(jīng)網(wǎng)絡機器翻譯技術、語音識別技術、OCR圖像識別等高精尖技術的集合性落地,讓AI機器翻譯技術融入到生活和工作場景中,讓每個人都可以享受AI技術給生活帶來的便利。

值得一提的是,本次大會的所有中英互譯同傳字幕均由搜狗機器同傳提供。隨著演講者的話語,字幕條即刻滾動更新,因其迅速的反應、準確的翻譯,獲得了參會嘉賓的認可。王小川表示:“機器和翻譯人員還是有距離的。我們內(nèi)部研發(fā)人員認為,在2020年時,可以在一些指標上趕上真人翻譯,一些地方甚至會更好,一些地方還有不足。”

搜索的未來是問答 讓回答一步到位

作為國內(nèi)第二大搜索引擎公司,搜狗一直致力于搜索技術的深耕和應用。去年,搜狗問答機器人汪仔參加《一站到底》,與節(jié)目中頂尖選手同場競技并取得勝利;今年的搜狗答題助手也幫許多人在“直播答題”類競賽中獲得了名次和獎金。但王小川顯然并不滿足于現(xiàn)有成績,他斷言:“搜索的未來是問答。未來搜索引擎不應該只給用戶一個網(wǎng)頁,而是給用戶直接提供答案,這中間包含著知識推理和檢索的能力。”

對此,他進行了更多的闡釋:“搜索引擎所做的不僅僅是搜索、檢索,更需要完成閱讀理解,因為用戶輸入的關鍵詞五花八門,問題的真實意思是機器所不能確定的。”比如,有網(wǎng)友搜索“王者榮耀排位上分最好的時間段”而最佳答案其實是“需要組隊、有給力的隊友”。這些語言的多樣性、問題的不確定性,都是搜索引擎、問答產(chǎn)品在未來需要面臨的問題。在這個方面,搜狗和學界持續(xù)合作,共同搭建數(shù)據(jù)庫、解決更多的問題。在雙方的通力合作下,相信搜狗會帶來更加貼合用戶心理的問答產(chǎn)品。

AI輔助對話:不炒“自動回復”冷飯

日前,在谷歌I/O大會上,主講人請?zhí)摂M語音助手Duplex自行預約理發(fā),測試中的Duplex在思維邏輯、對答正確性和速度方面,甚至還有極其類似真人的語音語調(diào),都令業(yè)界驚嘆。

與這款虛擬語音助手類似的“搜狗輔助對話”,或許是被大多數(shù)人忽略的一項功能,它不同于以往的“任務型對話”如siri,“聊天機器人”如微軟小冰,不再是機器按照模板對人類的問題進行反饋,而是基于大數(shù)據(jù),對人類對話時最可能出現(xiàn)的回復進行提示,由人類來掌控最終決定權,敲定最終回復的話語。機器所做的是為人類提高效率,而不是代替人類去回復、去思考。

而人類點選的動作和主動輸入的動作,也是對機器提供答案的評價,這類評價數(shù)據(jù),可以為機器的自主學習、自主更新提供資料,便于機器輔助對話性能的優(yōu)化提升。如今,機器輔助對話的應用場景已由手機短信擴展到聊天軟件,針對用戶多樣化、趣味性、個性化的表達需求,搜狗也在持續(xù)研究更復雜的檢索模型、深度學習模型,讓“搜狗輔助對話”實現(xiàn)更好的效果。

在演講的最后,搜狗公司CEO王小川透露,搜狗輸入法致力于自然交互,搜狗搜索則以知識計算為主,搜狗會考慮將二者的功能結合——“搜狗將不斷研發(fā)新的智能硬件產(chǎn)品,會在各種垂直領域推出虛擬個人助理,幫助用戶更好地表達和獲取信息。”

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2018-05-23
搜狗王小川:2020年 機器翻譯的某些指標可以趕上人類翻譯
北京時間5月20日,2018全球人工智能技術大會(GAITC)在北京召開。

長按掃碼 閱讀全文