華為投資深思考,多模態(tài)語(yǔ)義理解的時(shí)代來(lái)了?

引言:

語(yǔ)義理解一直被認(rèn)為是“人工智能皇冠上的明珠”。

近日,36氪獲悉,深思考人工智能機(jī)器人科技(北京)有限公司(以下簡(jiǎn)稱“深思考”)獲得華為旗下全資子公司哈勃科技投資有限公司(以下簡(jiǎn)稱“哈勃投資”)的數(shù)千萬(wàn)人民幣的戰(zhàn)略投資。

從深思考官網(wǎng)可以了解到,其最突出的技術(shù)是“多模態(tài)深度語(yǔ)義理解引擎(iDeepwise.ai)與人機(jī)交互技術(shù)”。官網(wǎng)顯示,該引擎技術(shù)可同時(shí)理解文本、視覺(jué)圖像等多模態(tài)非結(jié)構(gòu)化數(shù)據(jù)背后的深度語(yǔ)義,其中,對(duì)長(zhǎng)文本的機(jī)器閱讀理解技術(shù)、自由跨域的多輪人機(jī)對(duì)話技術(shù)、對(duì)多種模態(tài)信息的語(yǔ)義理解技術(shù)是其非常突出的優(yōu)勢(shì)。

讓人好奇的核心是兩個(gè)問(wèn)題,第一,深思考的核心技術(shù),即多模態(tài)深度語(yǔ)義理解與人機(jī)交互技術(shù)究竟是什么,又面向著怎樣的落地場(chǎng)景?第二,華為,或者說(shuō)華為的子公司為什么要投資深思考,這其中存在著怎樣的商業(yè)考量與生態(tài)布局?

從接下來(lái)的文章中,我們或許可以一窺一二。

1、多模態(tài)和多模態(tài)語(yǔ)義理解

在8月結(jié)束的“2019機(jī)器閱讀理解競(jìng)賽”中,在兩項(xiàng)核心技術(shù)指標(biāo)中,深思考均位列第一,從全球2000多支隊(duì)伍中脫穎而出,取得冠軍。當(dāng)時(shí)36氪,曾對(duì)深思考人工智能CEO兼AI算法科學(xué)家楊志明博士進(jìn)行過(guò)采訪。

“人類說(shuō)話的時(shí)候,往往是口語(yǔ)化的、不連續(xù)的、支離破碎的,甚至語(yǔ)序顛倒的。語(yǔ)音識(shí)別只停留在語(yǔ)音指令,不能理解用戶語(yǔ)言及背后的邏輯,實(shí)際無(wú)法解決用戶在很多場(chǎng)景中的剛需。”楊志明舉例,人類在看電影時(shí),不僅看畫(huà)面、聽(tīng)聲音,也會(huì)看字幕,甚至還會(huì)根據(jù)電影主題進(jìn)行聯(lián)想。

每一種信息的來(lái)源或者形式,就可以稱為一種模態(tài),例如,人的視覺(jué)、觸覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、味覺(jué),信息媒介包括,語(yǔ)音、圖片、視頻、文字等,而傳感器則有紅外線、雷達(dá)、電磁等,

多模態(tài)的人工智能,就是通過(guò)不同的信息維度和信息來(lái)源,幫助人工智能以更像人類的方式進(jìn)行思考和學(xué)習(xí)。

隨著算法、算力、云及芯片等技術(shù)的不斷成熟,人工智能,尤其是強(qiáng)人工智能在過(guò)去幾年快速發(fā)展。據(jù)WIPOP2019年人工智能趨勢(shì)報(bào)告顯示,50%的AI專利在過(guò)去5年內(nèi)發(fā)表,這意味著從2014年-2018年這五年內(nèi),AI產(chǎn)業(yè)進(jìn)入了快速發(fā)展的階段。

當(dāng)然,多模態(tài)的人工智能技術(shù)比單一模態(tài)的人工智能技術(shù),無(wú)論是對(duì)算法,還是算力的要求,都會(huì)復(fù)雜不少,甚至可能是指數(shù)級(jí)的復(fù)雜程度,但最終的呈現(xiàn)的效果,也會(huì)更接近人類。

以智能家居場(chǎng)景為例,語(yǔ)音識(shí)別技術(shù),實(shí)現(xiàn)的效果是聽(tīng)到語(yǔ)音指令,并執(zhí)行指令,一旦有復(fù)雜的語(yǔ)音表述,就會(huì)進(jìn)入,“我沒(méi)有聽(tīng)懂您說(shuō)的是什么”,或是,“您的意思是這樣”等,操作指令的進(jìn)一步確認(rèn),或者細(xì)化。

真正能夠幫助機(jī)器解決“聽(tīng)懂”和“看懂”的問(wèn)題,是靠語(yǔ)義理解,,而其中機(jī)器閱讀理解問(wèn)題一直被認(rèn)為是語(yǔ)義理解和自然語(yǔ)言處理(NLP)的標(biāo)志性臨界點(diǎn)。

據(jù)2018年年底騰訊研究院統(tǒng)計(jì),在中國(guó)人工智能企業(yè)中,融資占比排名前三的領(lǐng)域分別是計(jì)算機(jī)視覺(jué)與圖像,自然語(yǔ)言處理,以及自動(dòng)駕駛/輔助駕駛,而排在第二名的自然語(yǔ)言處理,融資122億元,占比19%。

深思考的“多模態(tài)深度語(yǔ)義理解引擎(iDeepwise.ai)與人機(jī)交互技術(shù)”,簡(jiǎn)單來(lái)說(shuō),就是實(shí)現(xiàn)從簡(jiǎn)單的機(jī)器感知到深度的語(yǔ)義理解,而這一點(diǎn),會(huì)使人機(jī)交互變得更加智能,也是機(jī)器真正邁向智能的關(guān)鍵。

這可能是深思考能夠吸引到華為投資的原因之一。

但顯然,并不是唯一的原因。

2、華為以及華為的生態(tài)

如今,人們已經(jīng)很難用一句簡(jiǎn)單的話,來(lái)概括華為,其產(chǎn)業(yè)鏈包括通信設(shè)備、半導(dǎo)體、消費(fèi)電子、云計(jì)算、安防等,公司營(yíng)收也從2008年的183億美金增長(zhǎng)到2018年的1052億美金。

不僅手機(jī)銷量超越蘋(píng)果,華為在5G、芯片和智能硬件端的表現(xiàn)也十分搶眼,尤其是5G產(chǎn)業(yè)上的發(fā)力,比如最新旗艦手機(jī)Mate30系列手機(jī),其搭載的麒麟990芯片,也是行業(yè)中第一枚正式商用的5G SoC芯片。

再比如面向全場(chǎng)景的分布式操作系統(tǒng)鴻蒙OS,據(jù)發(fā)布會(huì)上的介紹,鴻蒙OS已在手機(jī)、平板上率先進(jìn)行了使用,并將會(huì)應(yīng)用在智能手表、智慧屏、車載設(shè)備、智能音箱等智能終端上。

但光有OS、芯片和5G技術(shù),并不能完全實(shí)現(xiàn)華為設(shè)想的萬(wàn)物互聯(lián)的場(chǎng)景,他們像是華為未來(lái)AIoT戰(zhàn)略的基礎(chǔ),在基礎(chǔ)之上,需要更多有效的技術(shù)來(lái)增加基礎(chǔ)的抓手,落地更多的場(chǎng)景,觸達(dá)更多的用戶,并實(shí)現(xiàn)無(wú)感的體驗(yàn)。

多模態(tài)語(yǔ)義理解技術(shù)及類腦人工智能技術(shù),則能夠起到關(guān)鍵性的作用。

目前,深思考基于AI多模態(tài)深度語(yǔ)義理解技術(shù)與人機(jī)對(duì)話產(chǎn)品主要落地于智能車聯(lián)網(wǎng)數(shù)字座艙、汽車智慧營(yíng)銷、手機(jī)智能移動(dòng)終端、智能家居、智慧醫(yī)療健康等應(yīng)用場(chǎng)景。

以移動(dòng)端的場(chǎng)景為例,在智能手機(jī)終端場(chǎng)景下,深思考基于多模態(tài)深度語(yǔ)義理解與人機(jī)對(duì)話引擎(iDeepWise.ai),提供出行、健康咨詢、智慧辦公、休閑娛樂(lè)等場(chǎng)景的智能人機(jī)對(duì)話交互iDeepWise.ai.mobile 的AI Saas 服務(wù)。尤其在出行領(lǐng)域,為2億智能終端用戶提供一站式AI智能出行生活服務(wù),包括通過(guò)人機(jī)對(duì)話自動(dòng)完成預(yù)訂機(jī)票火車票、自動(dòng)完成酒店預(yù)訂等服務(wù)。

此前,通過(guò)哈勃投資,華為已經(jīng)投資了第三代半導(dǎo)體材料領(lǐng)域的山東天岳先進(jìn)材料科技有限公司、集成電路設(shè)計(jì)公司杰華特微電子(杭州)有限公司。不難看出,過(guò)去數(shù)月中華為戰(zhàn)略投資的三家公司,分別為華為提供了,人工智能所需的產(chǎn)品原材料、芯片設(shè)計(jì)生產(chǎn)和最適合的人工智能技術(shù)。

相信在未來(lái),這三家公司在華為的大生態(tài)之下,會(huì)有更多的交流和合作。

而華為子公司對(duì)于深思考的投資,似乎也標(biāo)志著,人工智能進(jìn)入全面商業(yè)化的階段,不再只在實(shí)驗(yàn)室進(jìn)行測(cè)試和訓(xùn)練,而是不斷在真實(shí)場(chǎng)景中區(qū)落地,去實(shí)驗(yàn),去更接近成功。

3、人工智能走出實(shí)驗(yàn)室

對(duì)于巨頭公司,尤其是ICT領(lǐng)域的巨頭公司而言,其擁有的海量數(shù)據(jù),就是儲(chǔ)量豐富的金礦,但如果無(wú)法挖掘和發(fā)揮數(shù)據(jù)的價(jià)值,數(shù)據(jù)的存在便變毫無(wú)意義。他們擁有用戶、產(chǎn)品和場(chǎng)景,卻缺少人工智能這樣的“煉金術(shù)”,來(lái)幫助煉金,從而最終在同類型公司之中勝出。

而對(duì)于人工智能公司而言,找到一個(gè)好的生態(tài)合作伙伴,或是一個(gè)擁有真實(shí)業(yè)務(wù)需求的投資方,能夠快速實(shí)現(xiàn)技術(shù)的落地,并最終實(shí)現(xiàn)商業(yè)化,尤其是還有云和芯片的相關(guān)產(chǎn)業(yè)鏈。

仍然以智能家居場(chǎng)景為例,智能音響、智能電視、智能冰箱、智能空調(diào)等產(chǎn)品,最終需要被語(yǔ)音理解所賦能,提升理解能力,真正做到人工智能。

結(jié)合多模態(tài)語(yǔ)義理解技術(shù),這些智能家居和智能硬件,不再是簡(jiǎn)單的人類語(yǔ)音命令執(zhí)行者,而是變成了隱形人工智能管家的觸點(diǎn),他們會(huì)更了解人類的需求和習(xí)慣,并提供更加個(gè)性化和人性化的服務(wù)。

以智能車聯(lián)網(wǎng)為例,5G和人工智能的發(fā)展,讓自動(dòng)駕駛和車聯(lián)網(wǎng)都被給予厚望。

傳統(tǒng)智能車載系統(tǒng),通常通過(guò)駕駛室的智能語(yǔ)音交互屏幕實(shí)現(xiàn)人機(jī)互動(dòng),而在智能車聯(lián)網(wǎng)場(chǎng)景下,汽車跟道路基礎(chǔ)設(shè)施之間、汽車跟汽車之間、汽車跟互聯(lián)網(wǎng)之間都能夠做信息的連接和交互。車輛本身也通過(guò)視覺(jué)對(duì)車外的環(huán)境做感知與理解,再加上溫度傳感器、語(yǔ)音信息輸入傳感器等。

對(duì)于用戶而言,語(yǔ)言是最有效的交互方式,但對(duì)于車輛而言,要接受和理解的語(yǔ)言,并且在極短時(shí)間內(nèi)做出反應(yīng),是有巨大的挑戰(zhàn)。而除了語(yǔ)言的模態(tài)外,智能車聯(lián)網(wǎng)還有手勢(shì)的模態(tài)和圖像的模態(tài)等信息。

數(shù)字化場(chǎng)景下,深思考提供的技術(shù)能為對(duì)上述多模態(tài)信息進(jìn)行綜合理解,為人車交互提供智能大腦,同時(shí),還可以在座艙環(huán)境下,實(shí)現(xiàn)人、車和家庭的連接。加上RPA自動(dòng)軟件機(jī)器人,不光可以實(shí)現(xiàn)人車對(duì)話,車輛還可以自動(dòng)幫助駕駛員完成任務(wù),比如預(yù)定會(huì)議室、與其他智能設(shè)備的聯(lián)動(dòng)、執(zhí)行等。

“更重要的是解決及提升物聯(lián)網(wǎng)和AIoT設(shè)備多模態(tài)語(yǔ)義理解的能力。”楊志明博士在此前36氪的采訪中曾提到, 未來(lái)的場(chǎng)景之中,更多的情況是,終端設(shè)備首先具備各項(xiàng)傳感器,能夠多維度的收集信息和數(shù)據(jù),同時(shí)端側(cè)AI芯片的植入,又能讓這類設(shè)備具有如圖像識(shí)別、語(yǔ)音識(shí)別、語(yǔ)義理解等人工智能能力,而云端則是更強(qiáng)大的算力和服務(wù)支持。一方面,如果所有終端的處理,都由云完成,性能和響應(yīng)可能會(huì)成為瓶頸,另一方面終端設(shè)備必須具備AI理解的能力,才能讓機(jī)器更好的理解人類意圖。下一個(gè)時(shí)代必定是AIot的時(shí)代,也是人工智能多模態(tài)語(yǔ)義理解的時(shí)代。

云、芯片和人工智能技術(shù),深思考的技術(shù)和華為生態(tài),相得益彰。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-10-12
華為投資深思考,多模態(tài)語(yǔ)義理解的時(shí)代來(lái)了?
引言:語(yǔ)義理解一直被認(rèn)為是“人工智能皇冠上的明珠”。

長(zhǎng)按掃碼 閱讀全文