嘉楠科技張楠賡:抓住計算架構變革的機遇是我們這一代人的事

日前,世界人工智能大會(WAIC)落下帷幕,本屆大會吸引了超過300家科技企業(yè)同臺亮相。作為一家ASIC芯片設計廠商,嘉楠科技不僅展示了近一年的商業(yè)落地成果,而且在大會期間正式發(fā)布了備受嵌入式開發(fā)者期待的AI芯片K510。

近2倍算力增長、全新的計算引擎,以及強大的視頻處理能力,勘智K510的發(fā)布意味著這家芯片廠商的疫后“芯”生。從2016年起,嘉楠科技就開始琢磨如何將ASIC設計技術遷移到AI領域,始于一顆指甲蓋般大小的芯片,這家公司的AI之路已經走了5年。

嘉楠科技張楠賡:抓住計算架構變革的機遇是我們這一代人的事

從2016年AI概念在國內萌芽到呈現(xiàn)燎原之勢,直至今日,業(yè)界對于AI的估值也逐漸回歸理性。潮水退去,曾經的“AI四小龍”已光鮮不再,取而代之的則是人們對芯片的熱切關注。隨著數(shù)據(jù)成為新石油,算法和算力正逐漸成為駕馭這個世界的通行法則。與各類算法層出不窮的現(xiàn)狀相反,算力的發(fā)展則充滿了混沌。摩爾定律被反復唱衰,異構計算、DSA概念大行其道,舊秩序瀕臨崩潰,而新秩序尚未建立。

和眾多本土AI芯片廠商一樣,嘉楠科技是中國上百家從事芯片設計的公司之一。但不同之處在于,嘉楠科技正式進軍AI之前已經進行了3年左右的ASIC芯片研發(fā)。ASIC是專用計算芯片,與人們電腦里的CPU不同,嘉楠科技早年研發(fā)的ASIC只能用來運行一種名為SHA256的哈希算法。在這家公司的董事長兼CEO張楠賡看來,ASIC芯片在計算效率上是最高的,因此從長遠而言,隨著算法趨于固定,ASIC芯片將是未來AI芯片的主流方向。

以ASIC設計為切口研發(fā)邊緣AI芯片

張楠賡是一名80后企業(yè)家,不同于那些叱咤互聯(lián)網江湖的形象,年逾三十就已頭染霜白,這部分緣于他所從事的行業(yè)。畢竟,在過去十年中,集成電路這一行業(yè)在移動互聯(lián)網熱潮下顯得寂寂無名。直到今天,芯片才成為人們在飯桌上也會提起的熱詞。

這一行業(yè)的技術門檻之高超過了多數(shù)人的想象。張楠賡曾說,即便是外界看來最簡單的區(qū)塊鏈ASIC芯片,要做到世界領先也至少需要5年左右的時間。張楠賡曾成功研發(fā)了世界上第一款運行哈希算法的ASIC芯片,并在2018年帶領團隊研發(fā)了業(yè)內第一款7nm ASIC芯片。

雖然“軟件定義硬件”這一說法在業(yè)界有不少擁躉,但在他看來,軟件工程師可能不太會注意到的一點是,計算架構改進可以使芯片算力達到數(shù)量級的提升。ASIC芯片就是一個最極端的例子,目前一臺主流計算設備的算力已經達到TH/s數(shù)量級,即每秒進行1萬億次運算。

嘉楠科技張楠賡:抓住計算架構變革的機遇是我們這一代人的事

作為一名科班出身的技術型企業(yè)家,張楠賡在軟硬件領域均有涉獵。本科期間,張楠賡就讀于北航電子信息工程學院,并在讀研期間主修計算機體系結構專業(yè)。學生時代他就曾跟隨導師參與龍芯項目,并且在宿舍里開啟了第一次技術創(chuàng)業(yè)。

2013年,嘉楠科技正式成立,并于短短三年內帶領技術團隊實現(xiàn)從110nm到16nm工藝節(jié)點的飛躍。區(qū)塊鏈ASIC設計領域取得的成功讓嘉楠科技有信心尋覓更多場景。在工程師團隊看來,通用計算對于算力的需求確實不高。但是在邊緣AI領域,設備需要更優(yōu)的算力和功耗設計來讓AI算法落地。

從區(qū)塊鏈ASIC轉向AI芯片,最大的質疑來自于嘉楠科技能否應對AI芯片設計復雜度的挑戰(zhàn),以及其如何在巨頭林立的市場中找到自己的立足之地。

但在張楠賡看來,AI芯片的底層邏輯依然是對數(shù)據(jù)流的處理。嘉楠科技在ASIC設計過程中積累了大量知識產權,涵蓋算法開發(fā)和優(yōu)化,標準單元設計和優(yōu)化,低電壓和高能效操作,高性能設計系統(tǒng)和散熱等,這些都是芯片設計的底層共性領域。公開資料顯示,截至2020年12月31日,嘉楠科技累計擁有178項專利知識產權(其中包括144項國內專利所有權、34項PCT國際申請)70項IC布圖設計權和105項軟件著作權。

  依托RISC-V研發(fā)自主IP核

2016年,嘉楠科技正式成立AI芯片部門,啟動邊緣芯片研發(fā)項目——勘智AI。研發(fā)團隊在ISA選型、功耗和功能設計上都全面瞄準邊緣AI,并在一開始就確立了依托開源架構研發(fā)自主IP核的技術路線。邊緣AI芯片的應用場景為邊緣服務器或設備端的推理計算,即根據(jù)訓練好的算法模型對數(shù)據(jù)進行預測。因為算法的部署位置靠近應用現(xiàn)場,邊緣芯片的功耗一般只有5W-10W,并且其時間延遲在毫秒級別。

任何類型芯片的設計中,ISA(指令集架構)是繞不過去的一個環(huán)節(jié)。它是軟硬件相互通信的核心樞紐,負責把軟件工程師編寫的代碼轉換為最底層的機器碼。自上世紀60年代以來,ISA的變遷先后經歷了X86和ARM時代,如今正在向新的方向過渡。隨著邊緣計算以及多類型設備聯(lián)網的興起,中小型設備的計算需要更加靈活的輕量級架構。

嘉楠科技張楠賡:抓住計算架構變革的機遇是我們這一代人的事

這一架構主要指向RISC(精簡指令集),并在目前區(qū)分出ARM和RISC-V兩個陣營。在ARM被初創(chuàng)公司普遍采用的情況下,嘉楠科技卻是國內較早基于RISC-V架構進行AI芯片研發(fā)的公司。這一選擇多少帶著些許預見性。2017年圖靈獎得主、計算體系結構宗師David Patterson與John Hennessy在《計算機體系結構的新黃金時代》一文中就表示,計算體系結構的第二個機遇是開源的ISA(指令集架構),為了創(chuàng)建一個「處理器的 Linux」,這個領域需要工業(yè)標準級別的開放 ISA。

在這篇論文中,作者所列舉的第一個例子就是RISC-V。除了開源特點之外,架構自身的簡潔性使其降低芯片設計和驗證硬件正確性的復雜度。同時,這款ISA避免了對微架構的過度依賴,沒有歷史包袱,而且為定制化設計的加速器提供很大的操作指令設計空間。

過去5年,嘉楠科技一直沿著自主研發(fā)IP核的技術路線行進。芯片整體采用SoC封裝方案,依托RISC-V架構和定制的視覺CNN加速器來提升任務處理效率。嘉楠科技第一款AI芯片勘智K210的加速器為KPU,峰值浮點計算速率1.082TFLOPS。在去年7月份,這款芯片成功獲得Linux內核支持。

除嘉楠科技之外,阿里平頭哥、華為等巨頭企業(yè)也在基于RISC-V架構研發(fā)芯片。RISC-V一度被業(yè)界視為ARM的挑戰(zhàn)者,特別是在ARM獨立性受到挑戰(zhàn)的當下。Nvidia和高通都對收購ARM公司表示出極大興趣,而RISC-V基金會則在中美貿易戰(zhàn)的當口主動將總部遷往瑞士。

當前RISC-V備受國內芯片廠商追捧,作為早先吃螃蟹的公司,嘉楠科技并不急于推出新的芯片,始終保持著2年一代芯片的節(jié)奏。AI芯片勘智K510于今年3月正式點亮回片,這意味著嘉楠在AI的商業(yè)化布局上或有更多動作。

這是一代人的事

從更宏觀的視角來看,相比16、17年的概念先行,本屆WAIC大會上,更多實實在在的優(yōu)秀技術成果隨之涌現(xiàn)。中國最大AI計算芯片、自動駕駛芯片,以及更多自主研發(fā)的架構創(chuàng)新和設計,一起構成了本土芯片行業(yè)的全新圖景。

嘉楠科技便是本土芯片企業(yè)快速成長的一個切片。張楠賡曾表示第一代AI芯片更多是一款工程師視角的產品。彼時MobileNet等視覺算法模型尚未出現(xiàn),因此在算力設計上稍顯滯后。深度學習技術及其應用擴展的速度正在倒逼每一家芯片企業(yè)加快步伐。

嘉楠科技的新款AI芯片勘智K510在算力和功耗設計上面向中高端市場。其核心在于團隊自主研發(fā)的KPU2.0,使得其算力相較于一代芯片有近3倍提升,并且搭載了MIPI高清攝像頭接口,提升在視覺應用領域的處理能力。隨著K510的面世,嘉楠科技將解鎖高清視頻會議、車載后裝市場和智能門鎖等更多應用場景。

對芯片企業(yè)而言,找到落地場景就意味著打開市場空間的可能性。新一代本土芯片企業(yè)如何在自己的市場撐出一片天,則有賴于更多像嘉楠科技一樣的企業(yè)給出自己的答案。誠如張楠賡所言,抓住計算架構變革的時代機遇,是我們這一代人的事。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )