平頭哥鑄劍,阿里造芯長征走出第一步

在2019年云棲大會主論壇,阿里巴巴CTO、達摩院院長張建鋒從口袋里掏出一款看得見、摸得著的芯片:含光800。這是一款AI芯片,重點應用于機器視覺中,如圖片識別、視頻識別等。作為平頭哥半導體公司首顆自主研發(fā)的芯片,含光800成為云棲大會主論壇的熱門話題。

全球最強AI芯片?

一年前的云棲大會上,平頭哥半導體公司宣告成立,這是阿里首次對外宣告要自主造芯,但事實上,阿里很早就已想要擁有自己的芯片,并為此籌謀許久。阿里當時宣布正在打造內部代號為“Ali-NPU”的芯片,主要針對圖像和視頻的AI任務加速場景,按照設計,Ali-NPU的性能將是同類產品的40倍。對于“40倍”這個數(shù)字,當時很多人是不信的。

從定位來看,含光800應該就是一年前所說的Ali-NPU,我注意到在發(fā)布會現(xiàn)場,張建鋒數(shù)次強調這款芯片很“大”——移動端芯片因為應用場景要求往往都強調體積的小,這意味著含光800的應用場景不是終端,而是云端服務器。“大”不是指體積大,而是計算能力強大,其每秒能處理78000張圖片。僅僅是從晶體管數(shù)量來看,含光800擁有170億個晶體管就遠超同行。

最能體現(xiàn)出其算力強大的則是一組對比數(shù)據(jù)。在業(yè)界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業(yè)界最好的AI芯片Habana Goya 高4倍;能效比500 IPS/W是其3.3倍。跟一年前市面上的英偉達P4比,性能有46倍的優(yōu)勢,“Ali-NPU 性能40倍于同類產品”不是吹牛。

含光800算力強大的原因在于面向AI視覺場景自研的架構和定制的算法,以下來自官方新聞稿:

“含光800硬件層面采用自研芯片架構,通過推理加速等技術有效解決芯片性能瓶頸問題;軟件層面集成了達摩院先進算法,針對CNN及視覺類算法深度優(yōu)化計算、存儲密度,可實現(xiàn)大網(wǎng)絡模型在一顆NPU上完成計算?!?/blockquote>

更具體的解釋:平頭哥針對含光800瞄準的機器視覺場景,自研了架構、軟件編譯器、框架、工具鏈等等,并針對INT8數(shù)據(jù)類型做了大量優(yōu)化,最終在性能、良率、功耗等指標上均表現(xiàn)良好。比如在架構上,含光800針對深度學習中使用的大量權重參數(shù)和張量數(shù)據(jù),在支持稀疏壓縮與量化處理的基礎上,通過獨特設計的數(shù)據(jù)訪存與流水線處理技術,大大減低了I/O需求和數(shù)據(jù)的搬移,NPU同時深度優(yōu)化了卷積,矩陣乘,向量計算和各種激活函數(shù),通過高有效的硬件資源調度和全并行的數(shù)據(jù)流處理,把AI運算的性能和能效雙雙推向極致,整個架構都是創(chuàng)新設計的。

換言之,這是一款軟硬件高度整合的AI芯片,用張建鋒的話說:傳統(tǒng)芯片公司擅長硬件,然而在算法上不具備優(yōu)勢。我看到在一個媒體社群記者們就“含光800是否全球最強”有不同看法,但毋庸置疑,在視覺這一場景下,在市面上的同類產品中,含光800從算力、能效比來看均絕對領先。

要注意的是,含光800不是一款PPT芯片,其已實現(xiàn)流片量產,應用到阿里商業(yè)生態(tài)中。對內應用在阿里核心業(yè)務上,張建鋒在云棲大會的現(xiàn)場演示現(xiàn)實,城市大腦實時處理杭州主城區(qū)交通視頻場景,原來需要40顆傳統(tǒng)GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms;拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。對外,含光800不直接售賣,而是通過云的形式向阿里云數(shù)百萬客戶售賣AI算力,基于含光800的AI云服務已正式上線,相比傳統(tǒng)GPU算力,性價比提升100%。

平頭哥一年當立

含光800的“含光”,將是平頭哥系列終端芯片的名稱。含光是上古時代三大神劍之一,《列子·湯問》:“孔周曰:’吾有三劍,惟子所擇。一曰含光,視不可見,運之不知其所觸,泯然無際,經(jīng)物而物不覺?!焙宦丁⒐舛灰?,意指含光系列芯片將主打無形卻強勁的算力。

百度了一下,另外兩大神劍分別是承影和宵練,這意味著,平頭哥或許還有更多寶劍靜候出鞘。不過,雖然平頭哥目前只有含光800,但其已擁有多款“寶劍”:7月25日,平頭哥在上海阿里云峰會上發(fā)布RISC-V處理器玄鐵910,其是業(yè)界性能最強的一款RISC-V處理器IP,就像楊過可以將玄鐵劍鑄成屠龍刀一樣,5G、人工智能、網(wǎng)絡通信、自動駕駛等領域的開發(fā)者可以基于玄鐵定制自有芯片提高性能提高一倍以上,同時將成本降低一半以上,在玄鐵之前則有C-Sky系列,均主打IoT場景;8月29日,在世界人工智能大會上,平頭哥發(fā)布無劍SoC芯片平臺,集成CPU、GPU、NPU等,降低芯片設計門檻。

在含光前,平頭哥發(fā)布的“寶劍”是幫助第三方鑄劍,不論是玄鐵還是無劍都旨在幫助企業(yè)降低芯片設計門檻,“讓天下沒有難造的芯片”是平頭哥成立的使命之一;含光800則是平頭哥給自己鑄的第一把劍,基于此讓企業(yè)擁有高性價比的AI算力。

至此,平頭哥的芯片布局已經(jīng)有了雛形:SoC平臺、處理器IP和自有芯片形成的自有+開放結合的全棧芯片生態(tài)。接下來平頭哥會延續(xù)玄鐵、無劍和含光三大系列進行完善,布局云上AI訓練芯片和端上的AI推理芯片,已經(jīng)確定的是平頭哥正在研發(fā)用于阿里云神龍服務器的SoC專用芯片,以滿足更多場景的算力需求。

不論何種形式,平頭哥都將讓算力在AI時代更加普惠,接下來,平頭哥將繼續(xù)在端上做芯片基礎設施,在云端給企業(yè)提供普惠算力,助力企業(yè)擁抱數(shù)字化經(jīng)濟。

從技術布局來看,平頭哥不是孤立的,它是阿里AI+芯片+云計算三位一體戰(zhàn)略的一部分,因為有AI算法優(yōu)勢,含光800作為第一代就擁有全球領先的性能;正是因為有飛天這一阿里自研的高性能云計算平臺,含光800性能才可以在云端被充分挖掘轉化為強勁算力;正是因為有云計算這一強勢業(yè)務,含光800才可以不售賣芯片只售賣算力的方式商業(yè)化,“芯片即算力,算力即服務”。

阿里巴巴在云計算上優(yōu)勢已經(jīng)確立,阿里云穩(wěn)居亞太第一;基于阿里豐富的應用場景和達摩院高端基礎技術的布局,阿里在AI技術上尤其是語音智能、語言技術、機器視覺、決策智能上正在構建優(yōu)勢,平頭哥基于云和AI的優(yōu)勢迎頭直追。阿里已形成“一拖二”的技術戰(zhàn)略格局,云計算領跑,AI和芯片齊頭并進,三者互相協(xié)同,你拉我?guī)А?strong>站在這樣的視角來看,阿里造芯成功有其必然性。

阿里造芯啟示錄

因為自研芯片成功而具備技術長板的例子很多,比如A系列處理器對iPhone的成功居功至偉,再比如麒麟處理器則讓華為成功走向了高端,因為缺乏自主芯片,在技術上體現(xiàn)出短板的公司不勝枚舉。芯片是計算的基礎,對科技公司至關重要,因此2018年以來科技巨頭都在造芯,不過現(xiàn)在看來最新一批“造芯新勢力”的領先者,是阿里平頭哥:

1、有了看得見摸得著的領先型產品,特別是玄鐵和含光;

2、有了全棧的芯片生態(tài);

3、有了大規(guī)模的商用,含光已被應用到阿里核心業(yè)務并通過阿里云以算力形式開放。

阿里造芯成功給行業(yè)的啟示是什么?我認為有如下幾點:

1、芯片技術不是研發(fā)一個App,心血來潮是做不成的。

芯片技術門檻相當高,一年半載很難有什么成就。表面上看,含光800是芯片研發(fā)領域的一個奇跡,平頭哥只用7個月就完成了含光800的前端設計,之后僅了3個月就成功流片,一般公司往往要經(jīng)歷兩次甚至多次流片才可能成功,平頭哥快速成功顯然不是因為“運氣好”,而是厚積薄發(fā)。

阿里十年來一直未曾擁有自己的芯片,日益復雜的阿里生態(tài)對計算提出的要求越來越高,然而工程師每天跟服務器打交道時逐步發(fā)現(xiàn),他們正在觸摸算力的邊界,就像當初決定去IOE以強化數(shù)據(jù)庫底層控制權一樣,阿里意識到一定要有自己的芯片,只有擁有自己的芯片才能擁有最極致的算力。

不過阿里沒有選擇蠻干,而是步步為營,阿里先是投資寒武紀、深鑒和Barefoot Networks等多家芯片公司,再收購中國大陸唯一擁有自主嵌入式CPU IP Core的公司中天微,有媒體報道稱馬云已投資中國大半個芯片圈,這一過程花了好些年。在投資收購芯片公司外,阿里2017年成立三年投資千億的基礎技術研究機構達摩院,人工智能和芯片技術是其重點研究范疇。而在硬件層面,阿里在服務器、FPGA以及存儲等領域擁有多年研發(fā)經(jīng)驗,此外,平頭哥團隊在體系結構、編譯技術等領域擁有深厚的技術儲備。

在軟硬件上都打好底子后,阿里才正式宣布“造芯”。阿里造芯是深思熟慮的結果,是戰(zhàn)略選擇,不是心血來潮更不是要蹭熱點。

2、對的策略,對的戰(zhàn)術,對的時機。

不論是PC還是移動芯片,發(fā)展都已接近極限。五年前PC衰落,芯片“夠用了”很難再有升級動能,Intel大力轉型移動;Intel移動化尚未成功,手機市場又進入下滑周期,移動芯片“夠用了”,智能手機的瓶頸不再是計算性能,而是網(wǎng)速、續(xù)航和交互,ARM被軟銀收購,2019年第二財季高通營收下降4.6%,芯片巨頭都在尋找新的方向?!?8個月性能翻番、成本減半”的摩爾定律,失效了。芯片產業(yè)的第三次浪潮是什么?答案很清晰,就是AI以及AI拉動的IoT、5G等產業(yè)浪潮。

2018年是一個非常好的節(jié)點:AI普及的趨勢,對算力,對數(shù)據(jù)能力,對芯片都提出全新的要求,同時創(chuàng)造了大量新的應用場景,這意味著新玩家有新的機會,我們會看到平頭哥做玄鐵是瞄準的IoT,含光則是瞄準了機器視覺這一AI強相關場景,這都體現(xiàn)出差異化競爭的思路,而不是去做手機芯片這樣的毫無勝算的市場,現(xiàn)在再去做手機芯片意義不大了。

瞄準AI和IoT場景是戰(zhàn)術選擇,2018年入場是時機選擇,而在策略上,平頭哥沒有一上來就發(fā)布自己的芯片,在含光發(fā)布前先發(fā)布了處理器IP玄鐵710和SoC無劍平臺,循序漸進。對的策略、對的節(jié)奏,對的時機,促成了平頭哥的首戰(zhàn)告捷。

3、全新的普惠模式,是一種戰(zhàn)略選擇。

平頭哥是芯片公司的“新物種”,它不是要做一家賣芯片的公司,做芯片的目的是解決自己問題,再將其開放出來實現(xiàn)技術普惠,這是一種戰(zhàn)略選擇。

阿里巴巴業(yè)務場景日益復雜, 對算力提出更高的要求,搜索、推薦、視頻分析、城市大腦、金融科技等等AI場景,存量芯片已難以滿足,這是阿里自主造芯的初心。

不過,只是解決自己的問題是不夠的,就像阿里云是將在阿里業(yè)務場景千錘百煉的各種技術開放一樣,阿里造芯最終同樣會走普惠路線。

在云棲大會上,阿里巴巴集團董事長兼CEO張勇在演講時提到一個說法:“如果說大數(shù)據(jù)是石油,算力就是發(fā)動機,它們共同構成面向數(shù)字經(jīng)濟時代的核心能力?!彼倪壿嬍牵寒敂?shù)據(jù)在數(shù)字經(jīng)濟時代以幾何倍數(shù)增加,能夠與之協(xié)同的是同樣幾何倍增的強大算力,讓數(shù)據(jù)被高效使用。而阿里巴巴商業(yè)操作系統(tǒng)正成為數(shù)字經(jīng)濟時代的基礎設施,在這一操作系統(tǒng)中,算力這一發(fā)動機要保持高速運轉的根本就是有強大的芯片。平頭哥成立的初心就是要讓算力普惠,不論是SoC和IP模式降低芯片設計門檻,還是在云端將含光800的算力開放出來,均體現(xiàn)出這樣的理念。

這樣的理念促成了平頭哥獨特的競爭力。PC和移動芯片都是“巨頭+巨頭”模式,比如Intel與Windows的“Win-Tel”聯(lián)盟,再比如高通/聯(lián)華科與手機巨頭間的聯(lián)盟。然而到了IoT時代這樣的模式很難再奏效了,一方面,只要有能力,巨頭都想做自己的芯片;另一方面,AIoT市場一定是碎片化和強應用驅動的,一款芯片賣一年的做法很難再適應如此復雜的芯片需求,芯片一定會走向面向場景定制和基于軟件定義,芯片公司一時之間也難以再找到牽手的巨頭,這時候,平頭哥做芯片基礎設施“讓天下沒有難造的芯片”模式就生逢其時,雖然才面世一年就已展現(xiàn)出強大的生命力。

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2019-09-25
平頭哥鑄劍,阿里造芯長征走出第一步
在2019年云棲大會主論壇,阿里巴巴CTO、達摩院院長張建鋒從口袋里掏出一款看得見、摸得著的芯片:含光800。這是一款AI芯片,重點應用于機器視覺中,如圖片識別、視頻識別等。作為平頭哥半導體公司首顆自主研發(fā)的芯片,含光800成為云棲大會主論壇的熱門話題。

長按掃碼 閱讀全文