3月29日,在亞洲大數(shù)據(jù)可視分析峰會(huì)上,海云數(shù)據(jù)創(chuàng)始人兼CEO馮一村發(fā)布了與重慶市公安科研所共同研發(fā)的唇語(yǔ)識(shí)別技術(shù)成果,并現(xiàn)場(chǎng)做了技術(shù)演示。作為人工智能的一個(gè)分支,唇語(yǔ)識(shí)別是個(gè)較少被涉及的領(lǐng)域,此前僅有英文唇語(yǔ)識(shí)別相關(guān)技術(shù),而海云數(shù)據(jù)此次展示的技術(shù)問(wèn)中文唇語(yǔ)識(shí)別,準(zhǔn)確率已達(dá)到70%。
唇語(yǔ)和語(yǔ)音識(shí)別非常不一樣,唇語(yǔ)屬于視覺(jué)識(shí)別和自然語(yǔ)言處理相結(jié)合的范疇,機(jī)器需要能識(shí)別出人臉、口型、唇部變化,之后再通過(guò)唇語(yǔ)識(shí)別模型將其所說(shuō)的話(huà)呈現(xiàn)出來(lái)。唇語(yǔ)的應(yīng)用范圍相當(dāng)廣泛,首先能幫助聽(tīng)力有缺陷的人更好地與外界溝通,其次可以廣泛應(yīng)用在刑事偵查和國(guó)家安全領(lǐng)域,人與機(jī)器的交互方式,也將在唇語(yǔ)技術(shù)的介入下變得效率更高。甚至有研究者認(rèn)為,唇語(yǔ)將是最終殺死密碼的一件利器。
與語(yǔ)音識(shí)別不同的是,唇語(yǔ)的機(jī)器識(shí)別從一開(kāi)始就比人工唇語(yǔ)識(shí)別準(zhǔn)確率要高好幾倍??梢韵胂笠幌拢S著唇語(yǔ)識(shí)別技術(shù)的發(fā)展,聽(tīng)力障礙者能夠弄清電視里的播音員在說(shuō)什么,公安人員搞清千里之外兩個(gè)人對(duì)話(huà)的內(nèi)容,用戶(hù)只需動(dòng)動(dòng)嘴唇不出聲就可在各個(gè)場(chǎng)合進(jìn)行登錄,過(guò)門(mén)禁甚至進(jìn)行消費(fèi)支付。很多人會(huì)把語(yǔ)音作為機(jī)器與人進(jìn)行交互的主要手段,事實(shí)上人機(jī)交互的方式也許多種多樣,唇語(yǔ)也可以是其中的重要一項(xiàng)。
海云數(shù)據(jù)是國(guó)內(nèi)大數(shù)據(jù)可視分析的領(lǐng)軍者,精于將大數(shù)據(jù)成果用可視化的方式呈現(xiàn)出來(lái),創(chuàng)建不到四年已取得優(yōu)異成績(jī),目前在北京、重慶、硅谷、上海等地都建有基地,總部設(shè)在重慶。重慶對(duì)于新興產(chǎn)業(yè)的發(fā)展當(dāng)戰(zhàn)略來(lái)做,兩江新區(qū)極力在基礎(chǔ)設(shè)施、營(yíng)商環(huán)境、政策扶持、財(cái)政援助等多方面投入力量,幫助企業(yè)加速發(fā)展,海云數(shù)據(jù)就是其中的重點(diǎn)支持企業(yè)。
在唇語(yǔ)識(shí)別方面,谷歌的DeepMind是領(lǐng)先的,與牛津大學(xué)合作開(kāi)發(fā)唇語(yǔ)識(shí)別計(jì)算機(jī),通過(guò)判斷嘴型來(lái)還原真實(shí)的語(yǔ)言,但距離應(yīng)用還有一段距離。海運(yùn)數(shù)據(jù)的唇語(yǔ)識(shí)別從時(shí)間上看并不比DeepMind晚多少,在英文準(zhǔn)確度方面已經(jīng)做到了80%,在中文準(zhǔn)確度方面已經(jīng)做到71%,在技術(shù)上也是領(lǐng)先的,在國(guó)內(nèi)目前來(lái)看也是獨(dú)一份,海云數(shù)據(jù)在這個(gè)領(lǐng)域已占得先機(jī)。
技術(shù)有了,應(yīng)用是個(gè)問(wèn)題,用在哪里需要認(rèn)真選擇。我們?cè)吹竭^(guò)很多黑科技,在熱鬧一陣后就歸于沉寂,原因并不是技術(shù)不好,而是應(yīng)用失當(dāng)。一個(gè)好的應(yīng)用場(chǎng)景被挖掘出來(lái),足夠帶動(dòng)后面更為豐富的應(yīng)用場(chǎng)景出現(xiàn),進(jìn)而推動(dòng)這一技術(shù)的推廣普及和商業(yè)化。海云數(shù)據(jù)的唇語(yǔ)識(shí)別,首先是要用在公共安全領(lǐng)域的,這個(gè)領(lǐng)域?qū)夹g(shù)標(biāo)準(zhǔn)和應(yīng)用的要求較高,在公共安全領(lǐng)域打開(kāi)頭陣,后面的應(yīng)用面推展就會(huì)很容易,實(shí)現(xiàn)產(chǎn)品化和商業(yè)化的難度也會(huì)降低。
人工智能技術(shù)的研發(fā)成本是非常高的,用市場(chǎng)來(lái)帶動(dòng)研發(fā)是非常明智的選擇。只有應(yīng)用的范圍更廣泛,才能從市場(chǎng)上獲取足夠利益,自有獲取了足夠利益,才能帶動(dòng)研發(fā)的進(jìn)一步發(fā)展,讓產(chǎn)品更好用,這是個(gè)良性循環(huán)的圈子。海云數(shù)據(jù)在唇語(yǔ)技術(shù)的應(yīng)用上,采取的是簡(jiǎn)化路徑的策略,研發(fā)出來(lái)就直接投入應(yīng)用,應(yīng)用中發(fā)現(xiàn)問(wèn)題隨時(shí)解決,不斷促進(jìn)技術(shù)的發(fā)展。人工智能目前發(fā)展速度較快,投入其中的公司必須把握好研發(fā)和市場(chǎng)的關(guān)系才能獲得最終成功。
如果把人工智能比作一間屋子,語(yǔ)音識(shí)別、視覺(jué)識(shí)別等項(xiàng)目就分別是通往這間屋子的入口,也是人機(jī)交互的關(guān)鍵。視覺(jué)識(shí)別能獲取的信息維度更多,使用環(huán)境限制更少,應(yīng)用范圍更廣。海云數(shù)據(jù)認(rèn)為,下一站就是AI和可視分析的強(qiáng)捆綁和強(qiáng)結(jié)合,先應(yīng)用在公共平安全領(lǐng)域,交通領(lǐng)域,軍工領(lǐng)域,以此打開(kāi)突破口,再應(yīng)用到一般企業(yè)和個(gè)人。這個(gè)觀(guān)點(diǎn)從根本上來(lái)說(shuō)是符合邏輯的,智能交通等領(lǐng)域的交互肯定更多會(huì)依賴(lài)于機(jī)器視覺(jué)識(shí)別,而海云數(shù)據(jù)在該領(lǐng)域已是一枝獨(dú)秀。
不管是語(yǔ)音識(shí)別還是唇語(yǔ)識(shí)別,都是機(jī)器識(shí)別技術(shù)的前端,后端的共同支撐是語(yǔ)義識(shí)別。語(yǔ)音識(shí)別目前要解決噪音和口音的問(wèn)題,唇語(yǔ)識(shí)別也要解決圖像質(zhì)量和光線(xiàn)的問(wèn)題,而這都是有待攻克的技術(shù)難題。在當(dāng)前條件下,讓唇語(yǔ)技術(shù)立刻發(fā)揮作用是不現(xiàn)實(shí)的,需要更多的優(yōu)化和技術(shù)上的突破,不過(guò)好在與世界先進(jìn)水平相比,中國(guó)的技術(shù)并不落后,產(chǎn)業(yè)發(fā)展的環(huán)境也持續(xù)向好,隨著海云數(shù)據(jù)這樣的創(chuàng)新性企業(yè)越來(lái)越多,會(huì)有越來(lái)越多的中國(guó)技術(shù)領(lǐng)先世界。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀(guān)察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀(guān)點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 騰訊隱身,令人生畏
- 迪卡儂的價(jià)格、lululemon的品質(zhì),平替正成為年輕消費(fèi)者的心頭好
- 三場(chǎng)與AI有關(guān)的死亡
- 100億美元史上最大融資的背后,國(guó)內(nèi)外巨頭齊瞄準(zhǔn)Data+AI
- 有一種羨慕叫“別人家的年終獎(jiǎng)”:京東采銷(xiāo)平均23薪,全網(wǎng)熱議“人的價(jià)值”
- 行業(yè)首個(gè)“人機(jī)大戰(zhàn)”對(duì)壘!AI翻譯已媲美人工
- 蘋(píng)果開(kāi)啟年終大促,降價(jià)1200元,被國(guó)產(chǎn)手機(jī)嚇怕了?
- 1999 元起,OPPO A5 Pro 超防水、超抗摔、超耐用
- 長(zhǎng)三角,如何把數(shù)據(jù)要素變成新長(zhǎng)江?
- 大模型,在內(nèi)卷中尋找出口
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。