匹馬搶三關(guān):訊飛翻譯機3.0的破障之戰(zhàn)

原標題:匹馬搶三關(guān):訊飛翻譯機3.0的破障之戰(zhàn)

技術(shù)和市場的兩股氣旋,正在催促翻譯機加速奔跑。

根據(jù)中國旅游研究院統(tǒng)計,2018年全年中國出境游旅客達到1.4億人次,比2017上漲1100萬,同比增幅達到了13.5%。時至今日,我們已經(jīng)可以確鑿地說,作為全世界出境游第一人次與消費額大國,“去那么大的世界看看”已經(jīng)成為了中國人的剛需。

與此同時,AI技術(shù)不斷進步正在倒逼消費級硬件做出回應(yīng)。除了音箱之外,翻譯機基本已經(jīng)坐穩(wěn)了AI硬件的第二把交椅。

然而客觀來說,今天的翻譯機市場并不是已臻完善。雖然市場的不斷打開,正在讓越來越多消費者意識到翻譯機這個選擇。然而與1.4億出境人次的巨大旅游市場相比,翻譯機的滲透率依然有很大提高空間。

在翻譯機剛剛站穩(wěn)腳跟的這個檔口,或許核心玩家必須回答這樣一個問題:怎么才能把翻譯機做得更符合真實需要?讓用戶從“可以試試翻譯機”,變成“喜愛翻譯機”?

5月21日,科大訊飛在上海世博中心召開了“你的世界,因A.I.而能”為主題的2019新品發(fā)布會。不出所料,其中重磅的年度產(chǎn)品是訊飛翻譯機3.0。

如果說,訊飛翻譯機的前兩代,完成了從無到有的“陣地戰(zhàn)”。那么3.0時代的訊飛翻譯機,打的則是一場闖關(guān)拔寨的“攻堅戰(zhàn)”。

語障:AI翻譯情景中的現(xiàn)實難題

客觀來說,今天的AI機器翻譯技術(shù)總體上已經(jīng)相當(dāng)成熟了。至少在英漢翻譯維度上,旅游場景的簡單翻譯已經(jīng)不是難題。

那么為什么很多需要外語表達能力的中國游客,依然不會在旅行中選擇翻譯機呢?

很大一部分原因在于,旅行和商務(wù)場景里,翻譯機面臨的窘境往往不來自簡單的英漢互譯的考核成績,而是來自充滿不確定性的現(xiàn)實因素。

比如在現(xiàn)實生活中,尤其是旅途中的翻譯需求,往往發(fā)生的短促而急迫。這時眾多因素都可能成為干擾,比如使用者的口音、周圍嘈雜的環(huán)境、突然失靈的網(wǎng)絡(luò),等等等等。而翻譯機面對的市場需求,恰恰是一個“木桶理論”:不管因為任何原因,只要失效一次,用戶就有可能產(chǎn)生逆反心理。一旦連續(xù)失靈,用戶就會產(chǎn)生再也不用翻譯機的想法。

這些難題,是在理想翻譯環(huán)境中都不存在的——也就是口譯人員經(jīng)常要面對的“語障”現(xiàn)象。

而AI翻譯能力從理想走入現(xiàn)實,需要將這些現(xiàn)實短板一一剔除。

在剛剛發(fā)布的訊飛翻譯機3.0中,我們可以看到一系列針對現(xiàn)實強應(yīng)用性的升級。其中最重要的因素在于,它從軟硬件結(jié)合的角度,完成了三場關(guān)鍵戰(zhàn)役的勝利。

眾聲喧嘩:現(xiàn)實翻譯場景中的環(huán)境之戰(zhàn)

現(xiàn)實應(yīng)用翻譯設(shè)備的第一個難題,就是環(huán)境中的不確定因素經(jīng)常導(dǎo)致翻譯失靈。其中比較具有代表性的問題,一個是翻譯環(huán)境可能會有噪聲污染,翻譯機很難聽清。再一個是沒有網(wǎng)絡(luò),翻譯機會失靈。最典型的環(huán)境,就是在飛機上用翻譯機與空乘人員溝通。

攻破這個環(huán)節(jié)關(guān)卡,必須要依靠硬件的突破。

在訊飛翻譯機3.0中,搭載了訊飛智能翻譯內(nèi)核、驍龍八核處理器和全球部署CDN。由此,訊飛翻譯機3.0的翻譯速度能夠達到“0.5秒閃譯”,有效避免了翻譯速度過慢帶來的尷尬。另一方面,通過“四麥降噪”技術(shù)、“雙揚聲器”裝置和“端到端”翻譯,訊飛翻譯機3.0能夠大幅降低噪音干擾。

面對另一個“環(huán)境殺手”——無網(wǎng)君,訊飛翻譯機3.0搭載了新一代離線內(nèi)核,包括新一代離線語音識別引擎、離線翻譯引擎。借助大功率處理器,離線語音識別訓(xùn)練模型規(guī)模擴大了5倍,中英文識別率超95%;翻譯模型容量增加105%,涵蓋詞庫規(guī)模擴大1倍。

這些翻譯機的“荒野求生”技能,讓其存在價值大大提升。畢竟翻譯機的另一重邏輯在于,其在特殊情況能夠發(fā)生一次作用,往往就意味著有備無患。而特殊情況,往往是在突發(fā)、無網(wǎng)和混亂情況下。

此外,喜聞樂見的拍照翻譯,在訊飛3.0版本里也被極大增強。并且在硬件端配備了圖文專業(yè)調(diào)校攝像頭、高清視網(wǎng)膜屏幕、閃光燈,確保拍照翻譯在各種光線環(huán)境下繼續(xù)工作。

可以看出,在硬件能力上的增強可以看作此次訊飛翻譯機升級的一條主干道。當(dāng)我們認為AI翻譯是一個純軟件工程和算法能力時,往往會忽略在消費者體驗面前,軟硬件能力從來是不可偏廢的。

好在這條路已經(jīng)被打開。有理由相信,計算能力、通信能力、收聲能力與拍照能力的綜合比較,會將翻譯機真正推向多元化市場。翻譯機正在過渡為智能手機相類似的綜合硬件,這或許也是科大訊飛未來的機會。

術(shù)業(yè)有道:打開深度體驗的行業(yè)之戰(zhàn)

目前翻譯機的市場受眾,主要集中在旅游場景中。其面向人群主要是有機會出國游,渴望自由行體驗,但又缺乏足夠的當(dāng)?shù)卣Z言交流能力。

然而事實上,翻譯機還有進一步打開市場的可能:在商務(wù)、游學(xué)、談判等場景中,具備專業(yè)能力的翻譯機市場,其實是一片廣闊的藍海。

這就需要翻譯能力從基礎(chǔ)的旅行工具,走向?qū)I(yè)場景。這也是訊飛3.0攻克的另一個語言壁壘:專業(yè)翻譯的可能與實踐。

繼2018年12月首發(fā)行業(yè)A.I.翻譯功能后,訊飛翻譯機3.0增加了新的行業(yè)AI翻譯場景,已經(jīng)覆蓋了醫(yī)療、外貿(mào)、體育、金融、能源、計算機、法律等七大行業(yè)。

運用行業(yè)AI翻譯能力,用戶可以改變很多不可能使用機器翻譯的場景。比如SUV是車型,這個誰都知道,然而在醫(yī)療場景里,它卻是標準化攝取值的意思。只有基于龐大的行業(yè)語料數(shù)據(jù)進行AI訓(xùn)練,這樣的垂直領(lǐng)域機器翻譯才有可能成真。

而這一關(guān)口的突破,意味著新市場正在向訊飛翻譯機打開,同時也為普通人提供了更多與世界相遇的可能。

他山之石:貼近真實需求的方言之戰(zhàn)

在翻譯機使用痛點中,還有一個重要因素是使用者可能帶中文方言,而對話對象也可能帶英文方言。

事實上,這是一個非常大概率發(fā)生的事件。翻譯機的目標用戶,往往是境外旅游的中老年人,他們有方言口音是非常常見的事情。而在國外旅行時,我們往往會發(fā)現(xiàn)當(dāng)?shù)氐纳碳遗c服務(wù)人員,基本都操著濃重有口音的英語。二者一結(jié)合,也就讓傳統(tǒng)意義上的翻譯機價值大打折扣。

由此可見,翻譯機想要更加貼近真實需求,就必須利用AI技術(shù),提供更具彈性的方言理解與輸出能力。

我們知道,方言識別與翻譯一直都是科大訊飛的技術(shù)優(yōu)勢。在訊飛翻譯機3.0中,獨家支持了中文方言翻譯,包括粵語、東北話、河南話、四川話以及有口音的普通話,另外還支持普通話和粵語互譯功能,維吾爾語和普通話互譯功能,藏語和普通話互譯功能。

而在外語方言上,訊飛翻譯機3.0也一次推了大招處理。支持英語 (加拿大) 英語 (英國)英語 (新西蘭) 英語 (印度)英語 (澳大利亞) 法語 (加拿大)孟加拉語 (印度)等方言的翻譯。

不難發(fā)現(xiàn)的是,進入3.0時代的訊飛翻譯機,走向的是貼合真實場景、真實需求之路。從考卷上走下來的訊飛,開始向現(xiàn)實世界中的翻譯難關(guān)發(fā)起猛攻。

三關(guān)之后,當(dāng)然還有很長的路要走。只要語言的巴別塔還在,攀塔者永不能停歇。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-05-22
匹馬搶三關(guān):訊飛翻譯機3.0的破障之戰(zhàn)
技術(shù)和市場的兩股氣旋,正在催促翻譯機加速奔跑。根據(jù)中國旅游研究院統(tǒng)計,2018年全年中國出境游旅客達到1.4億人次,比2017上漲1100萬,同比增幅達到了13.5%。

長按掃碼 閱讀全文