原標(biāo)題:上周網(wǎng)易有道在自家AI開放日上,都亮相了哪些黑科技?
上周網(wǎng)易有道公司舉辦了一場AI開放日活動,這雖然是有道公司第三次面向開發(fā)者舉辦AI開放日,但卻是向媒體首次開放,會上有道大秀AI肌肉,一口氣展示了20來項AI技術(shù),并通過旗下智云平臺全部向行業(yè)開放。
小編今天整理了一下,帶大家回顧下現(xiàn)場幾個印象比較深刻的技術(shù)。
欲摘取人工智能皇冠上的“明珠”國內(nèi)自然語言處理(NLP)哪家強?
正如有道首席科學(xué)家段亦濤詳解了有道在圍繞人類自然語言四大交互方式(聽、說、讀、寫)而展開,人工智能的目標(biāo)是要理解和復(fù)制人類的智能,而語言是繞不開的一大環(huán)節(jié)。 NLP更是被譽為人工智能皇冠上的明珠。
在人類對語言隔閡這一“自然現(xiàn)象”對戰(zhàn)的過程中,今年大火的人工智能翻譯硬件正在成為讓我們跨入一個全新時代的工具模板,有道發(fā)布了全新第二代產(chǎn)品-有道翻譯王2.0 Pro。
看完發(fā)布環(huán)節(jié),小編不禁想問如果機器翻譯技術(shù)都能變得這樣高效易用,相信我們也距離下次“進化”不遠了。那么在這樣一款A(yù)I翻譯機的背后,到底都需要哪些AI技術(shù)作為儲備?
其實網(wǎng)易有道一直以來都在累積機器翻譯技術(shù),在2008年的詞典時代,網(wǎng)易有道就應(yīng)用上了機器翻譯技術(shù)。經(jīng)過十年的累積,有道已經(jīng)積累了應(yīng)用于全場景、全應(yīng)用四大AI核心技術(shù)手段: 包括神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、語音識別(ASR)、語音合成(TTS)、文字識別(OCR)。
當(dāng)然最重要的神經(jīng)網(wǎng)絡(luò)翻譯(NMT)技術(shù)是有道一直以來的“看家手藝”,相比一個個單詞逐字逐句的翻譯,神經(jīng)網(wǎng)絡(luò)翻譯會從整個句子進行理解,結(jié)合上下文判斷詞義。生成的譯文自然也更加準(zhǔn)確,接近人類的語序。在翻譯界通用的評判標(biāo)準(zhǔn)BLEU中,英譯中和中譯英的BLEU值均領(lǐng)先同行7個多百分點。
(有道自研NMT技術(shù)目前實現(xiàn)以中文為核心語言的12種語言互譯,和以英文為核心語言的6種語言互譯,翻譯質(zhì)量均處于行業(yè)領(lǐng)先水平)
第二個文字識別技術(shù)(OCR),可以從圖片、PDF等等圖像介質(zhì)中識別文字,應(yīng)對拍照翻譯、多格式文檔翻譯一類問題。網(wǎng)易有道是國內(nèi)首家可以實現(xiàn)全自動多語言混合識別、橫豎斜排版面自動識別的廠商。這樣一來雙語學(xué)術(shù)文檔或是大規(guī)模圖片翻譯,都不再是難題。
(OCR技術(shù)走在全球前端,國內(nèi)多個第一)
那么基于優(yōu)勢的OCR技術(shù),目前有道的圖像翻譯實現(xiàn)了三大模式,用戶體驗節(jié)節(jié)攀升。
再早之前的拍照翻譯自不用多說,“原圖翻譯”在拍照翻譯基礎(chǔ)上基于原圖識別背景做處理后對用戶體驗再次進行大幅改進。
國內(nèi)首家AR實景翻譯,所見即所譯,對攝像頭中的文字內(nèi)容實時翻譯,這里面涉及到動態(tài)追蹤、神經(jīng)網(wǎng)絡(luò)翻譯、OCR組段分析、AR渲染等復(fù)雜技術(shù)。
當(dāng)然,最重要的語音識別(ASR)也是機器翻譯中的另一項重點技術(shù)。在語音識別技術(shù)中,如何過濾環(huán)境雜音、準(zhǔn)確捕捉語音,又如何面對多人對話場景精準(zhǔn)的分割出完整的會話邏輯,都是讓智能翻譯硬件應(yīng)對顯示場景的要點。此次有道在多語音識別、離線語音識別的研究上都有很多進展,也奠定了有道翻譯王此次離線功能的基礎(chǔ)。
值得一提的是,有道此次AI開放日上還展示了全新的語音翻譯體驗,采用流式語音識別、實時語音翻譯,用戶可以一邊說一邊即刻看到翻譯結(jié)果。這項技術(shù)有道翻譯官APP上率先應(yīng)用。
除了語音識別,語音合成(TTS)也是語音翻譯中的重要元素。翻譯后生成的語音能否模仿人類的聲音、口吻、停頓,成了機器翻譯比肩人工的重要元素。這次所展示的有道語音合成技術(shù)只需十分鐘的錄音文件就能模擬出原聲,合成效果與原聲真假難辨。除了增加機器翻譯的擬人能力,甚至還能應(yīng)用在教育場景中,讓AI模仿老師的聲音給孩子講課。
有了這“四大金剛”,一個基于人工智能的翻譯硬件才算有了核心的基礎(chǔ)設(shè)施。
人類的進化標(biāo)志從使用工具開始:AI企業(yè)在幫助人們找到“新石器”
人類的歷史就是一部“工具和技術(shù)”發(fā)展史。 真正幫助人類進化的,并不是一樣工具,而是技術(shù)的全面工具化。讓人類一步步從原始走向文明的,也不僅僅是石錐石斧某一樣工具,而是磨制石器的普及。AI企業(yè)正在做著類似的事情。
智能交互技術(shù)使智能設(shè)備聽懂人話看懂世界,并給予反饋。 有道首次對外披露的“有道魔鏡”技術(shù),“萬物可識別”的時代已經(jīng)到來!
語音助手功能基于購物場景中的實際應(yīng)用 。
在AI開放日上還一次性地針對教育、政企辦公和手機廠商三大行業(yè)詳細(xì)的AI解決方案。
可見網(wǎng)易有道想做的,不僅僅是一個工具的售賣者,而是技術(shù)工具化的普及者和推廣者。目前來看,這也是AI技術(shù)最顯著的趨勢。谷歌、百度等等巨頭企業(yè)也都在打造技術(shù)開放平臺,幫助AI技術(shù)快速落地,和各行各業(yè)結(jié)合塑造出適用的工具,一起去改變?nèi)祟愖约骸⒏淖兪澜纭?/p>
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。