來(lái)自南京工業(yè)大學(xué)的宋昊旻用聽(tīng)上去有些蹩腳的普通話(huà),在微軟人工智能大會(huì)的舞臺(tái)上,跟微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋進(jìn)行對(duì)話(huà)的時(shí)候,現(xiàn)場(chǎng)很多人都非常感動(dòng)。對(duì)于一個(gè)雙耳失聰?shù)娜藖?lái)說(shuō),只要拿著一部手機(jī),就可以跟人正常交流,是多么難的一件事。我們不會(huì)手語(yǔ),而他們聽(tīng)不到聲音,而我們和他們之間的鴻溝,現(xiàn)在只要有一部手機(jī)就幫助宋昊旻跟正常人溝通,甚至可以跟外國(guó)人交流了。
圖:宋昊旻(右)與微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋(左)
解決宋昊旻的溝通問(wèn)題,可能只是我們看到的其中一個(gè)小例子,幫助人類(lèi)解決更多語(yǔ)言的問(wèn)題,才是人工智能的專(zhuān)家們孜孜以求的目標(biāo)。微軟云與人工智能事業(yè)部全球資深技術(shù)院士兼首席語(yǔ)音科學(xué)家黃學(xué)東,正在微軟領(lǐng)導(dǎo)語(yǔ)音技術(shù)和語(yǔ)言翻譯工作,他們的工作就是想解決這些問(wèn)題。
從感知到認(rèn)知
二十幾年前的時(shí)候,沒(méi)有GPU,沒(méi)有DSP、TMS320……,那個(gè)時(shí)候的黃學(xué)東是不敢想象,計(jì)算機(jī)語(yǔ)音識(shí)別、語(yǔ)音合成能達(dá)到可以媲美人類(lèi)的水平,到今天來(lái)看,這已經(jīng)是很了不起的成就,是令語(yǔ)音識(shí)別這個(gè)領(lǐng)域的人值得驕傲的成績(jī)。
圖:微軟云與人工智能事業(yè)部全球資深技術(shù)院士兼首席語(yǔ)音科學(xué)家黃學(xué)東
從整個(gè)人工智能的發(fā)展水平來(lái)看,這是人工智能在感知層面的一大步。
不管是語(yǔ)音識(shí)別也好,計(jì)算機(jī)視覺(jué)也罷,都屬于“感知”層面,感知智能因?yàn)樯疃葘W(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)的發(fā)展,獲得了突破性的成果。但是在認(rèn)知層面,進(jìn)步還是有限的。
我們當(dāng)前看到的機(jī)器翻譯,實(shí)際上是處于感知到認(rèn)知之間的過(guò)程,它可以“假裝”聽(tīng)懂,來(lái)做翻譯工作,而且翻譯出來(lái)的效果還不錯(cuò),但實(shí)際上,它并沒(méi)有聽(tīng)懂。
今年,黃學(xué)東帶領(lǐng)團(tuán)隊(duì)在中英文新聞翻譯任務(wù)(WMT-2017)上首次實(shí)現(xiàn)了可以媲美人類(lèi)的機(jī)器翻譯歷史性突破,這是非常有歷史性意義的事實(shí)。語(yǔ)音和語(yǔ)言是人類(lèi)進(jìn)化中重要的要素,而現(xiàn)在,計(jì)算機(jī)第一次在翻譯質(zhì)量上超過(guò)專(zhuān)業(yè)人士的水平,這對(duì)人類(lèi)文明的進(jìn)展來(lái)說(shuō),都很有里程碑意義。
所謂“認(rèn)知”包括上下文推理,真正的自然語(yǔ)言處理,而這方面還需要更長(zhǎng)的路要走,那才是人工智能真正的皇冠,我們現(xiàn)在還沒(méi)有達(dá)到,也不知道什么時(shí)候達(dá)到。
可以想象一下,如果有一天,機(jī)器可以理解我們所有的文本,了解上下文,有推理的功能,這意味著機(jī)器可以24小時(shí)閱讀所有的新聞,所有出版過(guò)的文件、著作、科學(xué)文獻(xiàn),那是真正的“上知天文下知地理”,還有生物等等各個(gè)學(xué)科的知識(shí),那個(gè)時(shí)候的機(jī)器比愛(ài)因斯坦,因?yàn)閻?ài)因斯坦也是只懂物理,那個(gè)時(shí)候,才是真正的“強(qiáng)人工智能”的來(lái)臨。
強(qiáng)人工智能,一定是有自然語(yǔ)言理解,由感知驅(qū)動(dòng)的,讓計(jì)算機(jī)能達(dá)到人的知識(shí)獲取能力,可以通過(guò)閱讀自動(dòng)獲取知識(shí)。過(guò)去5000年人類(lèi)的所有文獻(xiàn),它都可以讀得一個(gè)字不忘,還有超過(guò)人類(lèi)的深入理解。
比如說(shuō),今天,我們引用《封神演義》里的一句:眼觀(guān)六路、耳聽(tīng)八方,其實(shí)《封神演義》里面講的不是六路,是眼觀(guān)四路、耳聽(tīng)八方。如果計(jì)算機(jī)在自然語(yǔ)言處理上進(jìn)步了,機(jī)器就可以指出“眼觀(guān)六方”是不對(duì)的,《封神演義》講的是四方,不是六方。
智能音箱、翻譯機(jī)開(kāi)始“感知”
當(dāng)然,讓黃學(xué)東感到遺憾的是,以目前的技術(shù)能力和水平,還不知道什么時(shí)候能夠?qū)崿F(xiàn)真正的“強(qiáng)人工智能”。但好消息是,在從感知到認(rèn)知的過(guò)程中,我們已經(jīng)有了一步一步的成績(jī)。
黃學(xué)東強(qiáng)調(diào),語(yǔ)音技術(shù)是一個(gè)賦能的技術(shù),所有的開(kāi)發(fā)者都可以把這個(gè)技術(shù)拿過(guò)來(lái),實(shí)現(xiàn)自己想要做的東西,比如智能音箱和翻譯器的火爆,是兩個(gè)很好的案例。
“現(xiàn)在遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別能力已經(jīng)很強(qiáng),所以音箱火得不能再火了,智能音箱也成為今年CES展上的重頭戲。音箱出現(xiàn)很重要的一個(gè)原因就是,語(yǔ)音識(shí)別技術(shù)進(jìn)步到了這個(gè)水平,遠(yuǎn)場(chǎng)交互都已經(jīng)達(dá)到了可用的水平,所以促使了智能音箱市場(chǎng)的火爆。”
今年另一個(gè)熱門(mén)產(chǎn)品翻譯器,尤其在中國(guó),是一個(gè)很大的市場(chǎng)。中國(guó)每年有1.2億的游客出去,微軟跟小米生態(tài)鏈企業(yè)香蕉出行合作推出的魔芋AI翻譯機(jī),能夠提供覆蓋全球170多個(gè)國(guó)家和地區(qū)的14種語(yǔ)言的實(shí)時(shí)語(yǔ)音翻譯,而且物美價(jià)廉,常常是脫銷(xiāo)狀態(tài)。
從翻譯的質(zhì)量來(lái)看,目前的翻譯機(jī)也是不遜色的。翻譯滿(mǎn)分是100分的話(huà),微軟最新的機(jī)器翻譯系統(tǒng)已經(jīng)達(dá)到了69分,可以媲美人類(lèi)。機(jī)器翻譯不像語(yǔ)音識(shí)別只有唯一的答案,機(jī)器翻譯是有很多種答案的,評(píng)價(jià)機(jī)器翻譯的時(shí)候,現(xiàn)在只能靠人為判斷?,F(xiàn)有的商用系統(tǒng)中,微軟和谷歌在標(biāo)準(zhǔn)的測(cè)試集上,得分分別在56分、54分左右,在微軟有最新突破之前,國(guó)內(nèi)的搜狗公司達(dá)到了62分的水平。
然而當(dāng)翻譯機(jī)火爆的時(shí)候,人工智能威脅說(shuō)也隨之愈演愈烈,人工智能會(huì)取代翻譯的說(shuō)法也鋪天蓋地。
但黃學(xué)東覺(jué)得,目前機(jī)器翻譯取代人類(lèi)還為時(shí)尚早,機(jī)器翻譯出錯(cuò)誤會(huì)出得比人類(lèi)更離譜,最好的方法就是在機(jī)器轉(zhuǎn)錄翻譯的時(shí)候,有人在旁邊看著,有錯(cuò)誤就給糾正一下,人和機(jī)器協(xié)同工作,這是最好的模式。
因?yàn)樵诔霈F(xiàn)冷僻的詞、新的概念的時(shí)候,機(jī)器往往會(huì)出錯(cuò)。人可以實(shí)時(shí)學(xué)習(xí)冷僻的詞和新的概念,這里面實(shí)際上包含很大的信息量,人類(lèi)馬上可以自適應(yīng),可以舉一反三,而機(jī)器就做不到。怎么樣處理沒(méi)有見(jiàn)過(guò)的事情,這才是真的智能,也是人類(lèi)智能和機(jī)器智能最大的區(qū)別。
“如果是沒(méi)有突發(fā)事件,那么是基本可信、基本可達(dá)、基本還算比較雅。如果出現(xiàn)突發(fā)事件,就舉一不可反三,這是人工智能和人的智能最大的差距?!?/p>
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )