智能音箱迎來升級戰(zhàn),語音識別成為其破局的關鍵

戶主回到家,室內燈就自動開啟,室溫調至適宜溫度;

同時類似siri的小管家,還會貼心告訴你該要添置哪些家用了,步驟也不勞你費心,只要下個命令,siri就會去線上下單;

當你出門在外,你的汽車能完美實現(xiàn)自動駕駛,根本不用操心路況和認路問題。

智能音箱迎來升級戰(zhàn),語音識別成為其破局的關鍵

以為這樣就玩了嗎?精彩的還在后頭——

如果在行駛的過程中你抑制不住心中的欲火開始..啪...啪...,這就算了,如果你還把玩著方向盤,siri是絕對不樂意了,還會勸你把管好你的幾幾。

你一定以為這是我幻想出的場景,其實不然,這是日前剛上映的外國科幻驚悚片《升級》中的場景。不過它或許在不久之后會映射入我們的真實生活場景當中。

智能音箱市場表面上形勢一片大好

在目前全球范圍內掀起的人工智能浪潮中,智能音箱作為全新的人機交互體驗最佳的入口,成為了世界科技巨頭們打開AI大門必爭的突破口。目前智能音箱市場仍舊以亞馬遜Alexa為領先,其次是谷歌,而蘋果Siri和微軟Cortana仍處于苦苦追趕之勢。據【TechWeb】8月7日消息,亞馬遜憑借著這波熱潮,在全球售出了超過5000萬臺Alexa智能音箱,并希望憑借這個機會將自家產品與智能音箱進行整合。

再回到國內,隨著BAT的不斷加持和其它實力毫不遜色的互聯(lián)網獨角獸的全力布局,國內智能音箱市場同樣迎來了前所未有的迅猛發(fā)展。根據Canalys的最新統(tǒng)計數據顯示,在2018年第二季度的全球智能音箱市場份額占比當中,中國智能音箱表現(xiàn)非常強勢,其中可以看到谷歌第一、亞馬遜第二,天貓精靈第三、小米第四。

智能音箱迎來升級戰(zhàn),語音識別成為其破局的關鍵

值得一提的是,小米作為后殺人互聯(lián)網的手機制造商,憑借著“高性價比”和“爆款”的模式迅速突破層層防線入主眾多領域建立起強大的小米生態(tài)體系,智能音箱就是其中輝煌的一筆。

小米從去年到現(xiàn)在扎努了整個市場的12.2%份額,我們看到小愛同學憑借一個非常低的價格,在國內市場頗受歡迎。與其他廠商不同的是,小米將智能音箱的門檻放得很低,而且打通了小米手機的語音助手,利用深度學習算法,做到不錯的表現(xiàn)效果。而在剛過去的15日,雷軍就宣布小愛同學的每月活躍設備數量超過3000萬,這也是小米IPO以來聽到的最好的消息。

由此可見,無論是在國外、還是在國內,智能音箱市場似乎整體看起來表現(xiàn)的都還不錯,形勢一片大好。但事實真的是這樣嗎?

智能語音的可控性值得擔憂

世界巨頭都在爭奪智能音箱通往AI的這個超級入口,但并不代表這個入口就已經足夠的成熟,只是巨頭們不想錯過這個最佳的入口而已。事實上智能音箱只是一個載體,核心在于搭載的智能語音交互系統(tǒng)(即語音識別),而語音識別作為研究AI的重要基礎,在語意的理解能力和識別的精準度的技術上是無法達到爐火純青的地步的,尤其是在搭載智能音箱之后的語音的控制上面值得擔憂。

盡管在考慮到全球語音市場的競爭格局之后,據外媒最新消息,亞馬遜Alexa和微軟的Cortana兩大語音助手正式聯(lián)姻。但也許仍然無法達到其預想中的完美形態(tài),譬如就無法播放部分在線音樂服務等。

這還不是最關鍵,最關鍵的是你無法掌握語音的可控性,簡單的來說,也就是你根本不知道什么時候就會無意間喚醒siri,更不知到從何時起你的談話被偷聽了,當快遞小哥突然給你送來一個包裹你卻還一臉懵逼。

據筆者在雷鋒網獲悉,在國外發(fā)生一件奇葩的新聞,亞馬遜Echo協(xié)助警方避免了一起謀殺案。國外一名男子在與女友發(fā)生爭吵時,男子拿槍指著女友質問她:“你給警長打電話了?”而在旁邊的谷歌 Home 聽到了“給警長打電話”的命令,所以也就按命令執(zhí)行了。最后特警隊抵達事件所在地,安全的制止了事件的進一步發(fā)生。

這看起來還算是一件很好的事情,至少Echo可以幫你解決突發(fā)的危險和狀況。不過接下來的案例就不得不讓你生無可戀、甚至驚悚。

據說,國外一家洋娃娃公司在電視上播放了一則玩偶之家的廣告,該地區(qū)竟然數個家庭的亞馬遜Echo在聽到廣告后自動開始在網上訂購玩偶之家。這還不算,在國內浙江大學電氣工程學院智能系統(tǒng)安全實驗室甚至曾成功對亞馬遜的音箱 Echo發(fā)起了“海豚攻擊”,通過利用麥克風的硬件漏洞,成功“黑”進智能設備的語音助手系統(tǒng),通過發(fā)出人耳無法聽到的超聲波語音,讓語音助手執(zhí)行他們所下達的指令,比如讓 Echo 在亞馬遜上買個東西。

智能音箱迎來升級戰(zhàn),語音識別成為其破局的關鍵

而更加驚悚的是,MWR InfoSecurity 的研究人員發(fā)現(xiàn),老款亞馬遜 Echo 智能音箱中存在一個安全漏洞,黑客可以將 Echo 音箱變成竊聽器,而又不影響它的整體功效。原理是研究人員通過制作的一個插頭把 Echo 連上了筆記本電腦和 SD 讀卡器。然后利用調試工具破解了 Echo 的系統(tǒng),寫進去了一個專用的引導程序。而這臺 Echo 所有聽到的音頻流都會自動轉發(fā)到他的遠程服務器上,關鍵的是這臺智能音箱的其他功能看上去竟然一切正常。

也就是如果一旦智能音箱被不法的黑客入侵,用戶的大量數據和隱私安全將受到大量的威脅。

口語仍舊是語音識別很難突破的壁壘

再回到語意識別的精準度上,雖然如今全球在AI技術上不斷的突破,語音識別的精準度和理解能力上也達到堪稱完美的地步,諸如曾經有媒體報道,谷歌Google Assistant將在2018年底將支持超過30種語言;除此之外,高通已經開發(fā)出了一款能夠識別單詞和短語的語音識別設備,準確率高達95%。

不過如果這用在中文測試上,或許會顯得很Low了。眾所周知,中國在經過幾千年的文化更替,其文字早已變得難以捉摸,尤其是演變出濃厚的各種地方特色語言早已超過了30種,就連中國人都不一定能夠聽得懂、更不用說毫無生機的機器語音識別了。

譬如,在一項研究中,就有人通過Alexa測試識別一些非本土口語的語種,結果顯示不準確率可達30%。而面對以西班牙語和漢語作為第一語言的人說英文,不管是Google Home還是亞馬遜 Echo,其識別率都是低的嚇人。

寫到最后

總而言之,語音識別在目前看來依然還存在眾多技術在短時間仍舊無法突破的壁壘。巨頭們大量的搶占智能音箱市場,只是因為它作為通往臥室鏈接AI最佳的解決方案。在巨頭們搶占了這個入口的同時,并不代表他就掌握了AI的超級入口,仍舊需要在語音識別的技術提升、創(chuàng)新上面不斷的研究和突破。

否則,即使你先搶占了智能音箱這個超級入口,但在智能音箱不斷迎來升級戰(zhàn)的過程中,你依然會很容易被后來者輕而易舉的超越和取代,畢竟AI作為技術創(chuàng)新極強的領域,只有不斷的技術創(chuàng)新和迭代升級,才有可能安穩(wěn)的渡過這場升級戰(zhàn),至于說能不能夠成為行業(yè)的標桿,至少得先活下來吧!

文/陳劍鋒

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2018-08-20
智能音箱迎來升級戰(zhàn),語音識別成為其破局的關鍵
戶主回到家,室內燈就自動開啟,室溫調至適宜溫度;同時類似siri的小管家,還會貼心告訴你該要添置哪些家用了,步驟也不勞你費心,只要下個命令,siri就會去線上下單;當你出門在外,你的汽車能完美實現(xiàn)自動

長按掃碼 閱讀全文