眼神科技周軍:十年一顧,再談多模態(tài)

2019世界創(chuàng)新者年會(huì)(World Innovators Meet 2019, 簡(jiǎn)稱WIM2019),于2019年12月6日在北京·國(guó)貿(mào)大酒店拉開帷幕。本屆大會(huì)由中國(guó)企業(yè)聯(lián)合會(huì)指導(dǎo),億歐·EqualOcean、工業(yè)和信息化科技成果轉(zhuǎn)化聯(lián)盟聯(lián)合主辦,以“科創(chuàng)4.0:共建全球化新未來”為主題,6000余名來自美國(guó)、英國(guó)、法國(guó)、澳大利亞、瑞士、以色列、俄羅斯、西班牙、葡萄牙、印度、新加坡等二十余個(gè)國(guó)家和地區(qū)的創(chuàng)新者齊聚一堂,共同總結(jié)2019年世界科技與產(chǎn)業(yè)創(chuàng)新的成果,預(yù)測(cè)2020年最新創(chuàng)新趨勢(shì)。

本次大會(huì)為期三天(12月6日-8日),采用“9+1”的會(huì)議結(jié)構(gòu),即于8日舉辦的“1”場(chǎng)創(chuàng)新領(lǐng)袖峰會(huì),于6日和7日舉辦的“9”場(chǎng)主題論壇。9場(chǎng)論壇分別圍繞當(dāng)下最熱門的零售新消費(fèi)、金融科技、投資新趨勢(shì)、智能硬科技、醫(yī)療大健康、產(chǎn)業(yè)互聯(lián)網(wǎng)等領(lǐng)域,以及青年、女性和科學(xué)企業(yè)家等群體展開。

在12月8日舉辦的創(chuàng)新領(lǐng)袖峰會(huì)上,眼神科技創(chuàng)始人兼CEO周軍發(fā)表了主題演講。他的主要觀點(diǎn)如下:

(1)多模態(tài)不是非此即彼的組合替代,而是基于數(shù)據(jù)融合的算法融合,并依托平臺(tái)決策為支撐。

(2)“多模態(tài)”是AI技術(shù)的下一步,更是AI落地的必經(jīng)之路。

以下是周軍演講全文(部分有刪減)

感謝主辦方的邀請(qǐng)。今天又站在這里,和去年不同,去年是講人工智能,今天講的是“十年一顧多模態(tài)”。這個(gè)單模態(tài)是什么,兩模態(tài)是什么,三模態(tài)又是什么?多模態(tài)到底是什么?

  人工智能發(fā)展了這么長(zhǎng)時(shí)間,大家對(duì)他的預(yù)期越來越接近實(shí)際情況。剛剛一個(gè)朋友問我,人工智能到底發(fā)展到哪一步了?說實(shí)話,我不知道。我突然想講一個(gè)小故事。養(yǎng)寵物的人很多,當(dāng)你回到家里面,小狗會(huì)根據(jù)你的情緒做出反應(yīng):你開心的時(shí)候,它會(huì)陪你一起開心;當(dāng)你累的夠嗆在沙發(fā)上時(shí),它會(huì)乖乖的呆在你的身邊。我們家有一個(gè)小狗叫天球,如果昨晚它把你的拖鞋叼走了,當(dāng)你早上醒來的時(shí)候,它會(huì)立刻叼回來;當(dāng)你走向衣櫥的時(shí)候,它會(huì)立刻跑到門口等著給你開門。這么簡(jiǎn)單的一個(gè)小狗,它能根據(jù)你的表情、行為時(shí)間,能判斷出你是否開心并做出一系列的反應(yīng)。

我想給大家說一下,就這么一個(gè)小狗的智商,人工智能需要花多長(zhǎng)時(shí)間做到?按照現(xiàn)在的人工智能,或者弱人工智能時(shí)代,沒有20年很難做到這一步。這意味著,人工智能再過20年都很難達(dá)到小狗的水平,那么達(dá)到小孩的水平需要多少年?

那么人工智能接下來該怎么做?什么是多模態(tài)?

讓我講講多模態(tài),眼神科技從事人工智能20多年,十多年前就在從事多模態(tài)的技術(shù)的落地,我有一些感想感悟、落地的案例和經(jīng)驗(yàn)想分享一下。

多模態(tài)在去年開始成為焦點(diǎn),很多知名企業(yè)比如說華為、騰訊、百度,這樣的AI大廠,都開始逐漸的把目光瞄向多模態(tài),很多創(chuàng)業(yè)公司也在思考這個(gè)方向性的問題。華為投資多模態(tài)語義理解的公司,騰訊的AI Lab的俞棟博士有那么一句話“多模態(tài)是邁向通用人工智能的重要方向”。通用人工智能是弱人工智能時(shí)代需要走向的一個(gè)方向,弱人工智能是 “見多識(shí)廣”,解決的是感知的問題,通用人工智能具有幾個(gè)屬性:自學(xué)習(xí)、增量學(xué)習(xí)、增強(qiáng)學(xué)習(xí),這些內(nèi)容結(jié)合在一塊,是強(qiáng)人工智能。從弱人工智能到強(qiáng)人工智能的奇點(diǎn),截止目前還沒有突破。 “見少知多”、“不見而預(yù)知”的強(qiáng)人工智能時(shí)代,這是很多年國(guó)際前沿人工智能公司一直努力的事情,技術(shù)遇到了天花板。

多模態(tài)指的是多傳感器融合,不是非此即彼的組合替代。指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別、指靜脈識(shí)別,每一個(gè)技術(shù)、每一個(gè)算法用一個(gè)傳感器解決一個(gè)問題叫單模態(tài)。隨著AI的發(fā)展、信息增加,AI被賦能被期待的模態(tài)越來越多,比如文本識(shí)別,圖片識(shí)別、文本和圖片組合識(shí)別、圖片和視頻組合識(shí)別等,各種信息從不同的方位,不同的傳感器到來,單一識(shí)別技術(shù)已經(jīng)很難滿足這樣的發(fā)展。

如何解決識(shí)別誤導(dǎo)和傳感器感知局限問題,如何讓機(jī)器像人一樣感知和理解這個(gè)世界,我認(rèn)為是多模態(tài)才可以解決的問題。眼神科技致力于讓機(jī)器和人交流的時(shí)候,使機(jī)器具有像人一樣的眼睛,眼神科技因此而得名。

多模態(tài)市場(chǎng)需求旺盛,國(guó)外領(lǐng)軍企業(yè)堅(jiān)持多模態(tài)。

國(guó)外知名的生物識(shí)別企業(yè)都在研究多模態(tài),多模態(tài)已經(jīng)成為生物識(shí)別發(fā)展趨勢(shì),EBA(歐洲生物識(shí)別行業(yè)協(xié)會(huì))告訴我一個(gè)數(shù)據(jù),到2023年歐洲生物識(shí)別的訴求達(dá)到115億美金。根據(jù)我們公司去年的情況,我們的人臉、虹膜、指紋三種技術(shù)在公司業(yè)務(wù)中已經(jīng)形成了“三分天下“的收入角色。

眼神科技在多模態(tài)生物識(shí)別領(lǐng)域已經(jīng)耕耘了20年時(shí)間。從1998年到2005年,公司一直在做指紋識(shí)別,在這期間也發(fā)現(xiàn)了指紋存在的問題,于是和人臉進(jìn)行融合。這個(gè)階段是公司指紋技術(shù)發(fā)展、指紋和人臉融合的發(fā)展階段;2005年到2013年階段,這也是我來北京創(chuàng)業(yè)的階段。在這個(gè)時(shí)期,公司利用成熟的指紋識(shí)別技術(shù),打開了全國(guó)50%的銀行市場(chǎng)。之后又開發(fā)人臉識(shí)別、虹膜識(shí)別技術(shù),虹膜識(shí)別技術(shù)我們從2005年開始研發(fā),到了2009年已經(jīng)達(dá)到了全球頂級(jí)程度,這是整個(gè)基礎(chǔ)算法形成的過程。

在面向市場(chǎng)的推廣過程中,我們發(fā)現(xiàn)單一技術(shù)決策存在的一些問題,更需要打造分層決策,于是我們打造了ABIS多模態(tài)統(tǒng)一平臺(tái)。整個(gè)公司技術(shù)研發(fā)過程中,我們獲得了400多項(xiàng)發(fā)明專利,獲得了國(guó)家技術(shù)發(fā)明二等獎(jiǎng)。多模態(tài)決策體制是如何形成的?包含了融合算法,平臺(tái)決策,ABIS平臺(tái)三個(gè)方面,是基于數(shù)據(jù)融合的算法融合,并依托平臺(tái)決策為支撐打造。

從AI應(yīng)用最前線——金融行業(yè)看多模態(tài)

眼神科技的研發(fā)一直是陪伴一個(gè)行業(yè)長(zhǎng)大的,這個(gè)行業(yè)就是金融行業(yè)。公司在1998年就開始研究指紋,2002年,我們開始定位銀行并且做試驗(yàn)。指紋的發(fā)展存在的最大問題,就是有很多人天生指紋淺、經(jīng)常參加體育活動(dòng)和體力勞動(dòng)的人指紋也非常淺,舉例有一家公司有20萬人,其中1%的人指紋識(shí)別困難,用解決方案也無法解決。“科技不從善“讓指紋識(shí)別技術(shù)遇到了巨大挑戰(zhàn),于是我不得不把人臉和虹膜結(jié)合在一起解決問題。解決了銀行內(nèi)部風(fēng)控的問題后,如何降本增效,如何獲客成為銀行發(fā)展的第二階段。用人臉識(shí)別可以解決獲客問題,可以做到人臉聯(lián)網(wǎng)核查和VIP的識(shí)別。運(yùn)營(yíng)過程中又發(fā)現(xiàn),尤其手機(jī)遠(yuǎn)端獲客,在幫著銀行降低成本和獲客的同時(shí),會(huì)遇到防偽的問題,人臉識(shí)別不能作為獲客的單一的識(shí)別手段,于是我們把人臉和虹膜識(shí)別組合起來識(shí)別。隨著銀行開放和生態(tài)的建設(shè),”追客”和”幫客”成為銀行重要的需求,這對(duì)生物識(shí)別和人工智能提出更大的挑戰(zhàn)。如何在場(chǎng)景中識(shí)別人、物、客,以及客戶需求的把握、精準(zhǔn)營(yíng)銷如何去做,讓銀行服務(wù)進(jìn)入你的消費(fèi)空間,進(jìn)入你的生活,這個(gè)過程就需要生物識(shí)別技術(shù)的融合應(yīng)用。今年,眼神科技中標(biāo)了工商銀行人臉識(shí)別產(chǎn)品引入和虹膜、指靜脈算法提升服務(wù)項(xiàng)目,實(shí)現(xiàn)了指紋、人臉、虹膜、指靜脈四項(xiàng)核心生物識(shí)別技術(shù)與工商銀行全面合作。多模態(tài)是現(xiàn)在很多銀行都在努力探索的方式。

到目前為止,眼神科技通過多模態(tài)生物識(shí)別技術(shù),服務(wù)全球2000多家客戶,渠道客戶1000多家。經(jīng)歷了二十年發(fā)展,在國(guó)內(nèi)可以說是陪伴金融成長(zhǎng),也可以說是被金融驅(qū)使,一刻沒有停過,過去二十年一直在創(chuàng)新??偨Y(jié)一下,眼神多年的發(fā)展過程中,遇到問題、解決問題,用多種生物識(shí)別技術(shù)融合決策、多種技術(shù)解決一件事情。

我認(rèn)為多模態(tài)是長(zhǎng)期發(fā)展的一個(gè)方向。希望更多的創(chuàng)新者,在各自領(lǐng)域的單模態(tài)上,好好的創(chuàng)新、耕耘,大家一起為人工智能未來的發(fā)展創(chuàng)造一個(gè)良好的環(huán)境,謝謝大家!

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-12-09
眼神科技周軍:十年一顧,再談多模態(tài)
眼神科技創(chuàng)始人兼CEO周軍蒞臨2019世界創(chuàng)新者年會(huì)并做演講,他提出:“多模態(tài)”是AI技術(shù)的下一步,更是AI落地的必經(jīng)之路。

長(zhǎng)按掃碼 閱讀全文