云知聲創(chuàng)新事業(yè)部總裁陳吉勝: 面向AIoT的人機交互云端芯演進之路

由中國高科技行業(yè)門戶OFweek維科網(wǎng)和高科會主辦、OFweek人工智能網(wǎng)承辦的“2018中國(上海)國際人工智能展覽會暨OFweek(第二屆)國際人工智能產(chǎn)業(yè)大會”于8月30日在上??鐕少彆怪行某晒εe行召開。

大會現(xiàn)場座無虛席,其中有數(shù)十位專家、院士,百余名名企代表蒞臨現(xiàn)場,大會緊張、激烈的氣氛持續(xù)到9月1日,多位嘉賓帶來了精彩絕倫的演講。

其中,在AI技術論壇中,云知聲創(chuàng)新事業(yè)部總裁陳吉勝給大家?guī)怼睹嫦?a href="http://ygpos.cn/AI_1.html" target="_blank" class="keylink">AIoT的人機交互云端芯演進之路》的主題匯報。介紹了智能硬件AIoT時代的五大挑戰(zhàn),以及大家普遍認為的云端芯演進路線圖。除此之外,陳吉勝先生還介紹了云知聲在今年5月份推出的首款面向AIoT的人機交互AI 芯片UniOne。

陳吉勝先生

以下是陳吉勝先生的現(xiàn)場演講內(nèi)容,OFweek小編作了不改變原意的整理和編輯:

各位好,我是來自云知聲的陳吉勝。今天我給大家?guī)淼姆窒眍}目是《面向AIoT的人機交互云端芯演進之路》。AIoT實際上就是AI加IoT,我們簡寫了一下叫AIoT,我們認為在IoT的時代可能交互發(fā)生一次比較重大的變化。因為以前更多的是PC機,然后是手機,而手機從按鍵然后變成觸摸屏。

那么到了IoT的時代,大家可以看周邊大部分音箱是沒有屏幕的,所以觸摸是沒辦法用了??赡軙€攝像頭,但是相比攝像頭而言,或許麥克風會更便宜一點,所以語音成為一個比較自然的交互方式。

在IOT時代,其實可以認為AI加IOT,這個時代更大的巨頭實際上已經(jīng)在進入到這一個領域了,這里我列舉幾個國外巨頭。Google曾經(jīng)出過自己的音箱,而且我前兩天看報告,Google的音箱的出貨量已經(jīng)超過亞馬遜了,而亞馬遜的AI已經(jīng)是IoT的一個象征。然后微軟他們最近也在大力發(fā)展人工智能這一塊,我看他們做多語種的翻譯做的如火如荼的,當然微軟肯定不僅僅在這一塊。然后蘋果之前做過一個音箱,不過我們認為是玩票性質(zhì)的。當然蘋果他們也可以說是語音應用的鼻祖——Siri??偟膩碚f,蘋果在人工智能這方面還是一個非常重要的玩家。

國內(nèi)對于AIoT來說也是一個比較熱門的一個話題,關于這一塊的具體的內(nèi)容,我想可能大家對政府的政策已經(jīng)見得比較多,包括在上海的人民政府,對于包括像云知聲在內(nèi)的這種AI企業(yè)是比較關懷的,這也充分說明了政府對于這一塊的未來空間和市場比較看好。

其實人工智能不是一個新東西了,因為已經(jīng)從提出到現(xiàn)在有60多年了,之前起來了兩次,最后都掉下去了。那么現(xiàn)在大家都有一個疑問,就是第三次行不行?因為技術上面確實是有改進,通過深度學習,但是因為前兩次不太好的記憶,所以大家也比較擔心。目前, 360公司做了很多的視覺分析技術,并且發(fā)現(xiàn)機器分辨率實際上已經(jīng)超過人眼了,而這一次我們認為它將進入一個實用的階段,時間點就在很多這種視覺人工智能公司成立的時間點。 因為機器視覺一旦超過人之后就一去不回頭了。

那么同樣語音也是如此,這個機器對于聲音的聽力方面也超過人的耳朵了,以前同樣技術可能是有,但是效果不好,可能最終的客戶捏著鼻子買了,但是到家里也不用了?,F(xiàn)在從視覺到聽覺,實際上機器確實在大部分的場景下面已經(jīng)超過了人的眼睛和耳朵,這就意味著進入到了一個實用化的階段。但是我們說超過人類主要是指感知這一塊,也就是在“視覺”和“聽覺”,但是在“理解”這一塊離人差距還很大。

舉個例子,可能這個字他都聽得懂,但是他不一定能把它理解的對。比如小龍女說:“我想過過過兒的日子?!笨催^金庸小說的用戶,會理解我說的這句話,否則可能會認為是一句錯的語句。這個就充分說明了“聽得到”和“聽得懂”之間還有很大的一個區(qū)別,所以現(xiàn)在有很多的智能硬件大家都覺得比較傻,可能有人買了一個音箱回去,覺得這個東西其實挺傻的。問題在于他不是聽不到,而是他是聽不懂,而聽不懂也不是所有的都聽不懂,而是說在一個開放的狀態(tài)下面他確實聽不懂,但是在一些特定的領域下面,現(xiàn)在的聽得到和聽得懂都做得相當好。

剛才講了那么多激動人心的背景,但現(xiàn)在為什么大家感覺AIoT的智能硬件不像手機那樣到處可見,因為今天來到現(xiàn)場,大家如果想要要拍照,一定是拿出手機點擊下就完成拍照,但是并沒有拿一個智能硬件出來對吧?因為智能硬件離這個手機還差得挺遠,我曾經(jīng)跟手機行業(yè)的一個老板聊過,他告訴我在中國做手機,如果想活下去,他一年的出貨量要3000萬,否則供應鏈是不會搭理他的,這就意味著它的成本會比別人高。

那對于硬件,可能我們現(xiàn)在說出任何一個智能硬件的種類,它不要說3000萬,可能1000萬甚至是500萬都是一個巨大的坎,為什么呢?我們覺得做智能硬件AIoT時代有五個挑戰(zhàn)。第一個是用戶體驗,雖然手機已經(jīng)成長的比較成熟了,大家用手來用也非常熟悉。但是你面對一個智能設備去跟它聊天,而且考慮到剛才我說的有時候它還不一定能理解,你只能在某些特定的領域下面,而這一塊在整個的交互設計方面,用戶體驗方面可能會存在一些問題。另外一個叫場景適配。手機我們帶著風里來雨里去都沒問題,但是有一些設備,比如說在車載里面的,你總不至于把它拿下來到辦公室用,另外一個你在辦公室用的設備可能也不一定愿意拿回家用,所以這也就意味著很多的智能設備,它在給你提供便利性的同時,它也是適配于一些場景。第三個就是產(chǎn)品運營,很多有志于做人工智能的公司,無論是應用還是基礎研發(fā),大家可能都不希望最終成為一個純粹的代工商。所以都會有自己的一個云平臺去運營,但是要搞云平臺這件事情可能不比做一個硬件要來得容易。尤其是穩(wěn)定性、防攻擊等各種各樣的問題。然后在這一個基礎上,你還得有足夠大的出貨量,你才能做一些相關的運營,這個也是一個很大的挑戰(zhàn)。還有一個是非常直接的問題,就是成本,現(xiàn)在這個方案的成本,既包括硬件的成本,也包括軟件開發(fā)的成本,整個成本算上來,如果你的量不是特別大,可能你的成本不會讓人家覺得容易接受。那最后一個就是開發(fā)周期,開發(fā)周期實際上也是一個很大的問題??赡苣闱懊嫠膫€都做得挺好,但是一年半以后才能出來,那時候時代早已改變。

所以綜合這五條,這是為什么我們認為現(xiàn)在IoT真正落地其實面臨的挑戰(zhàn)是非常多的,有了挑戰(zhàn)肯定是要去找解決方案,其實也是這個機會。解決方案是什么呢?就是我們認為實際上應該要想做好,肯定是要提供云端芯的整套解決方案,那么云端把服務和內(nèi)容拿過來,那么終端選好一個比才能實現(xiàn)一個美好的愿望,也是我們必須要往這條方向走的路。那無論公司處于全鏈條的云端芯,還是屬于其中的一部分,我們認為方向都是往這個方向。

我們認為一般的演進路線圖是什么?從云知聲本身的發(fā)展,以及包括我們看到的很多的創(chuàng)業(yè)公司,甚至是大公司在AIoT的發(fā)展路徑圖上面一般都這樣,首先能力開放,最簡單的就是搭個云平臺把API放出來,但是后面會發(fā)現(xiàn)效果很差,差體現(xiàn)在兩個方面:第一個沒錢,因為大家用你的API一般不付費;第二個,如果別人用自己的API用得不好,沒準還惹來一身罵名。所以這就進入到第二步,自己做一個產(chǎn)品證明技術能力是很強的,需要向市場證明、向消費者證明、甚至要向投資者證明。那就進入到一個單品交互的智能。單品交互之后,大家感覺還不夠,因為你僅僅只有一個設備,可能萬紫千紅才是春,所以大家開始進入到中控。中控比較有代表性的這就是小米的小艾同學,還有天貓精靈。尤其是小艾同學,只要你買的是小米的設備,基本都能鏈接,它可以作為一個中控來控制整體。

但這樣的話最大的一個問題是什么呢?對于小米,這個問題可能不是個問題,但如果只是一家中小型的企業(yè),這個時候就比較頭痛了。因為從先不說云終端有這么多的方向,尤其是終端的硬件里面,它有各種各樣的平臺。今天高通出一個芯片,明后天別家又各出一個,然后我們選擇一種芯片之后,配相應的團隊,團隊做了之后,這個產(chǎn)品的量可大可小,最后就形成了一個帶有一定風險的項目投入。對于一個公司來說,如果不能有大規(guī)模起量項目的投入,最后是不可持續(xù)的,因為你的人力成本、方案成本都放在那了。所以大家也希望找到一個更通用的、集成度更高的,無論是芯片本身硬件的集成,還要包括芯片上面的這種AI的能力的集成,以及基于AI能力上面的交互整套方案的集成。如果有這么一個東西拿到手上隨便改改,然后可以快速驗證,做一些深度的調(diào)試就可以往外推,至少可以把成本和周期打下來,我想這是大家目前做到現(xiàn)在一個非?,F(xiàn)實的需求。

對于前面我所講的問題,對于云知聲自身來說該怎么做?一般我們就是做云端芯,我們有自己的云平臺,面向不同的終端,包括車載、家居、醫(yī)療教育,它們都是不同的終端,我們都提供了相應的解決方案。關鍵問題點在哪?就在我剛才所說的,公司如果想一個比較高效的方式來打這個市場的話,它需要找到一個破局點,那這個破局點是什么呢?

這個破局點我們認為就是芯片的研發(fā),我們在今年5月份發(fā)布了面向物聯(lián)網(wǎng)的AI芯,也叫UniOne。UniOne的量產(chǎn)的封裝是個BGA的封裝,這顆芯片主要的特點是:第一個它的功耗比較低,功耗低來自于兩個方面,第一個它的制作成本低,它不需要做到14納米,也不需要做到7納米。其次它的主頻也比較低,因為我們把整體的神經(jīng)網(wǎng)絡用硬件的方式實現(xiàn)了,所以普通的通用芯片可能需要1.4G四核的計算能力,它只需要500兆。加上所有的引擎,包括離線喚醒、離線識別都已經(jīng)在上面了。

我們在9月份會在深圳舉辦一個開源的大會,也就是基于我們這個引擎上面所有的交互會全面的開源,這樣的話剛才我所談到的開發(fā)的周期和成本都會大大的降低,這是根據(jù)我們在物聯(lián)網(wǎng)進行摸爬滾打5、6年,最后給出我們認為的一個破局點。同時我們跟京東、億咖通合作,我們會跟億咖通一起做一個車載上面的AI芯片。

還有我們最終的一些商業(yè)落地的情況,其中智能家居,包括格力、美的,包括目前最火的兒童陪伴型的機器人,然后包括醫(yī)療、教育這一塊,云知聲均有涉及。

以上是我今天匯報的內(nèi)容,謝謝。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )

贊助商
2018-09-06
云知聲創(chuàng)新事業(yè)部總裁陳吉勝: 面向AIoT的人機交互云端芯演進之路
由中國高科技行業(yè)門戶OFweek維科網(wǎng)和高科會主辦、OFweek人工智能網(wǎng)承辦的“2018中國(上海)國際人工智能展覽會暨OFweek(第二屆)國際人工智能產(chǎn)業(yè)大會”于8月30日在上??鐕少彆怪行?/div>

長按掃碼 閱讀全文