神經(jīng)網(wǎng)絡(luò)架構(gòu)—讓AI真正的活起來

自定義AI加速走勢高漲。在云計算領(lǐng)域,阿里巴巴繼亞馬遜、谷歌之后,推出了自己的定制加速器。Facebook也參與其中,微軟在Graphcore中持有大量股份。英特爾(Intel)和Mobileye在汽車領(lǐng)域擁有強大的邊緣人工智能(AI),而無線基礎(chǔ)設(shè)施開發(fā)商正在為5G的小電池和基站增加AI功能。所有這些應用程序都依賴于大量靈活性和對未來的檢驗,以便在快速發(fā)展的環(huán)境中獲得長期的相關(guān)性。

但是有許多應用程序,對于它們來說,功率、成本或透明的使用模型是更重要的度量標準。一個農(nóng)業(yè)監(jiān)視器在一個偏僻的地方,一個微波語音控制器,交通傳感器分布在一個大城市。對于這些問題,一個通用的解決方案,甚至一個通用的AI解決方案,都可能是多余的。所以,一個特定的應用程序的AI功能將會更加引人注目。

人工智能時代之前,你會立刻想到一個硬件加速器——它可以做任何它必須做的事情,但比在CPU上運行一個軟件要快得多。這就是人工智能加速器的作用。它可能仍然是以軟件驅(qū)動的,但與通用CPU方式不同。軟件是在大型平臺(如TensorFlow或Torch)上用Python開發(fā)的,然后通過多個步驟編譯到目標加速器上。

這就是神奇之處。只要加速器保持在神經(jīng)網(wǎng)絡(luò)架構(gòu)的一般范圍內(nèi),它就可以像你希望的那樣狂野。它可以支持多個卷積引擎,每個引擎又由SRAM作為一個整體來支持,同時還支持本地內(nèi)存,以優(yōu)化對操作的優(yōu)先順序的訪問。

它可能支持專業(yè)功能池等常用操作。為了提高速度和性能,它通常會在不同的推理階段支持不同的字寬,并在處理稀疏數(shù)組時支持專門的優(yōu)化。這兩個領(lǐng)域都是神經(jīng)網(wǎng)絡(luò)架構(gòu)的創(chuàng)新熱點,一些架構(gòu)師甚至嘗試使用單比特權(quán)值——如果一個權(quán)值只能是1或0,那么你就不需要在卷積和稀疏性增加中進行乘法運算了!

所有這些的挑戰(zhàn)在于,當你想要致力于最終架構(gòu)時,你會發(fā)現(xiàn)有太多的旋鈕,以至于很難知道從哪里開始,或者你是否真正探索了全部的可能性空間。更加復雜的是,你需要在大范圍的大型測試用例(大圖像、語音樣本等等)上測試和描述。

用C語言而不是RTL來運行大部分測試是常識,因為它比RTL運行速度快幾個數(shù)量級,而且比RTL更容易調(diào)優(yōu)。此外,神經(jīng)網(wǎng)絡(luò)算法可以通過高級合成(HLS)很好地映射,因此你的C模型可以不僅僅是一個模型,它還可以是生成RTL。你可以探索你正在考慮的選擇的能力、性能和區(qū)域含義——多個卷積處理器、本地內(nèi)存、字寬、廣播更新。所有這些都具有快速的周轉(zhuǎn)時間,允許你更充分地探索可能的優(yōu)化范圍。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-03-18
神經(jīng)網(wǎng)絡(luò)架構(gòu)—讓AI真正的活起來
自定義AI加速走勢高漲。在云計算領(lǐng)域,阿里巴巴繼亞馬遜、谷歌之后,推出了自己的定制加速器。Facebook也參與其中,微軟在Graphcore中持有大量股份。

長按掃碼 閱讀全文