云知聲黃偉:物聯網環(huán)境下的AI芯片大挑戰(zhàn)

云知聲黃偉:物聯網環(huán)境下的AI芯片大挑戰(zhàn)

11月9日至10日,科技智庫「甲子光年」在北京舉行2019「甲子引力」大會。其中,在11月9日下午舉行的“數字智能”專場上,云知聲創(chuàng)始人、CEO黃偉以“底層崛起:邊緣計算 AI芯片”為主題展開了分享。

黃偉談到,算法在過去很多時候理論上很美,但若沒有算力支撐的話,很難達到非常好的效果。這也是為何今天人工智能很熱的時候,突然發(fā)現芯片也很熱,因為深度神經網絡需要更多的數據和算法,也需要更強的算力。 芯片是一個比較漫長的周期,從研發(fā)到流片、設計,周期以年為計,里面任何一個判斷失誤都會導致比較大的損失。黃偉提到,做芯片更多還是考量在今天這個時代,芯片能夠滿足用戶哪些需求,以此出發(fā)點倒推在芯片設計的時候要考慮哪些要素。

演講要點如下:

1、很多算法理論上很美,但需要算力來支撐。

2、5G普及之后,對邊緣計算能力要求越來越高。

3、在物聯網環(huán)境下做AI芯片面臨很多挑戰(zhàn),重要的是考量芯片能滿足用戶哪些需求。

現場演講實錄

很多算法理論上很美,但需要算力來支撐

很高興今天來參加這個活動,我今天的題目是《底層崛起:邊緣計算AI芯片》。先介紹一下AI芯片的背景,這個圖很多人在很多場合都看到過,人工智能的幾次高潮與低谷。我想從我個人的經歷介紹下,因為我自己也算是從人工智能整個低谷到漸漸起來這一過程的親歷者。

云知聲黃偉:物聯網環(huán)境下的AI芯片大挑戰(zhàn)

云知聲今天是做聲技術的,比如說語音識別、自然語言理解等,其實我碩士論文是做圖像,那是在上世紀末,1998、1999年,當時我的導師給我分配的研究課題是來給一些醫(yī)學圖片切片編輯成可交互、旋轉、可渲染的3D model。那時候主頻只有100兆,做三維的動作困難是很大的。我做完可以出去玩,兩三個小時回來那個機器掛了,那個時候很痛苦。當時博士階段就換了一個方向,做語音識別。 我的博士論文開題也是用神經網絡來做語音識別。那個年代很多人會覺得“神經網絡”是騙子,我自己也深深以為神經網絡是騙子,因為效果很差。如果訓練集和測試集環(huán)境比較一致的話效果還可以,如果換個集合效果就一塌糊涂。 當時又轉了一個方向,因為遇到一個另外問題。當時理論非常完美,但測算了一下,基本跑一個模型需要兩周時間。那個數據集有兩千人,意味著這個跑一遍要四千多周。算了算不行,博士從開題到畢業(yè)只有兩年時間,做這個可能畢不了業(yè)。所以我就想辦法結合統(tǒng)計模型,解決了數據的篩選,把幾十萬的數據變成幾十、幾百的數據。 這個例子講什么呢,就是這種算法在過去很多時候理論上很美,但沒有算力來支撐的話,很難達到非常好的效果。其實在某個特定歷史時期,計算能力本身就對算法做了設定,甚至對理論了做一個設定。所以這就是為什么今天人工智能很熱的時候,突然發(fā)現芯片也很熱了,我認為這是一個合理的過程。因為深度神經網絡需要更多的數據,更多更復雜的算法,當然需要更強的算力。

5G普及之后,對邊緣計算能力要求越來越高

過去還聽到一種聲音說,5G時代我們可以把更多數據都上升到云端,組合到一起去做。這是否能解決問題呢?當然不是。天下之勢,分久必合,合久必分,沒有互聯網之前其實我們都是邊緣計算,有了互聯網之后我們開始把數據在云端進行處理,所以我們看到有一段時間云計算特別火。到一定階段之后之后,我們又進入另一時期,就是端云結合,我們既需要云端的集中處理,可能也需要一些邊緣側的分布式處理。這個時代背景下,最近幾年我們國內其實涌現了一些非常優(yōu)秀的AI芯片公司,包括今天到場嘉賓,像地平線、寒武紀還有很多都是在各自領域里努力做一些工作,使得對中國的發(fā)展能起到有益的幫助。 講到AI芯片戰(zhàn)略意義,其實講大道理沒用,就以一個例子來講,比如說我們知道今天的車不再只是一個交通工具,它的能力開始延展,我們也會在汽車里面通過聯網獲得很多的服務,包括在線導航、在線歌曲,在線實施優(yōu)化以及自動駕駛,我們還會把不同車的信息在云端進行處理,其實這就意味著車也會成為一個IoT的T之一。

我們是不是可以直接把這個東西就放在里面,直接通過5G來做,現實其實不是這樣的。即便今天5G普及了,我們也很難保證在任何的路況、在任何地區(qū)5G信號都可以實時、毫秒級處理。

第二個是說我直接把這個算法跑到汽車應用上行不行,答案可能也是不行。舉例說,假設你今天買了輛車,你會發(fā)現這個車的電腦設計其實很一般,因為這些元力件都是五年前、八年前定型的,它的主頻處理器運行并不特別高,假如說在處理速度不是很高的芯片上面,我們又跑了一個非常消耗計算資源的AI的應用,又是什么后果呢?以我們做的語音交互為例,當我開車的時候說一句話,跟汽車通過語音進行交互,就可能會導致這個汽車的主控芯片的CPU被阻塞,從而可能導致非常嚴重的交通事故。這就需要我們在不動主控芯片的情況下,是否有一個專用芯片來處理人和汽車的之間的對話,它來處理汽車一些娛樂性等等。隨著5G隨著普及之后,其實我們對邊緣計算能力要求越來越高。

物聯網AI芯片面臨的挑戰(zhàn)

在物聯網環(huán)境下,我們做AI芯片面臨很多挑戰(zhàn)。過去傳統(tǒng)芯片經過初步競爭之后剩下一些巨頭,這些巨頭充分競爭的結果是每個巨頭按照自己的研發(fā)計劃交出一個產品,下游廠商沒有選擇權。我們會看到有段時間手機廠商發(fā)布會說我們采用了驍龍700、800芯片,用戶也不知道驍龍700、800到底是什么,只是覺得它快。在物聯網環(huán)境下我們做芯片面臨的問題,首先就是這個芯片的任務是什么。其次在人工智能時代我們面臨很多現實問題,例如在AI設計上怎樣才能低功耗,聯網之后設備的安全性怎么保證,這都是AI芯片需要解決的問題。

云知聲黃偉:物聯網環(huán)境下的AI芯片大挑戰(zhàn)

未來是什么在決定著物聯網AI芯片的設計,實際上還是那幾個問題,首先要面向場景和任務,這個AI芯片一定是端云結合,在設備端要給用戶提供多模化處理能力。第二個要構筑一個最矮墻,提升CPU的效率,使得算力非常強,舉個例子就好比說回轉壽司,一個大哥飯量非常好,吃得非???,但你轉的太慢的話他也吃不飽。

簡單總結一下,過去幾年我們在芯片方面的一些歷程,可能因為很早吃過算力不足以支撐算法的虧,所以很早意識到算力的重要性,除了自己搭建算力平臺之外,我們也很早就意識到了芯片研發(fā)的重要性,2015年我們開始組建團隊做這個事情。 云知聲這幾年,從研發(fā)、流片到量產和發(fā)布,今年初我們也發(fā)布了自己的第一代產品。去年是語音芯片,今年開始推出我們的多模態(tài)芯片。這個有幾個特點,一是算力比較強,可以達到4個T;第二是支持多個NPU組網;第三是可重復計算,芯片即使流片之后,后續(xù)如果算法升級,這個芯片也可以支持算法去不斷進行升級。當然除了語音之外,其實還包括圖像,可以在芯片端實現聲音、圖象、信號等多模態(tài)的處理能力。上個月我們剛剛流片一個DSP芯片,比較快的話應該年底會回來。

云知聲黃偉:物聯網環(huán)境下的AI芯片大挑戰(zhàn)

其實我們可以看到,云知聲并不是追求軍備競賽,多少算力,我們更多還是考量在今天這個時代,芯片能夠滿足用戶哪些需求,從這個出發(fā)點倒推,我們在芯片設計的時候把哪些要素考慮進來。

當然,芯片是一個比較漫長的周期,從研發(fā)到流片,到設計,到量產,這個周期是以年為計的,這里面任何一個判斷失誤都會導致芯片出來時造成比較大的損失。我們?yōu)槭裁匆鲂酒?,就是為了?guī)模量產,但一旦出現失誤,就會造成很大的損失。 在落地方面,我覺得在今天的環(huán)境下,很多團隊面臨的不僅僅是技術問題。我們都知道今天可能資本是寒冬,也知道今天的國內環(huán)境是科技戰(zhàn)的環(huán)境,科技是需要燒錢的,但資本沒有錢。在這種背景下,創(chuàng)業(yè)企業(yè)怎么把科創(chuàng)演進規(guī)劃跟市場比較好的結合在一起,這可能是每一個創(chuàng)業(yè)公司需要面臨的問題。 大概這些,謝謝大家。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2019-11-22
云知聲黃偉:物聯網環(huán)境下的AI芯片大挑戰(zhàn)
11月9日至10日,科技智庫「甲子光年」在北京舉行2019「甲子引力」大會。

長按掃碼 閱讀全文