蘋果A系列芯片的三年AI進(jìn)化:為何要大規(guī)模升級AI算力?

原標(biāo)題:蘋果A系列芯片的三年AI進(jìn)化:為何要大規(guī)模升級AI算力?

9月16日,蘋果秋季新品發(fā)布會如約而至,但傳聞中的iPhone12卻要等到下個月才能見到。發(fā)布會僅上新了兩款智能手表和兩款iPad平板電腦,新品iPad Air 4則搭載了最新的處理器芯片A14 Bionic(仿生)處理器。這幾款新產(chǎn)品香不香另說,A14 Bionic處理器卻成為了此次發(fā)布會的最大亮點(diǎn)。

根據(jù)蘋果的介紹,A14 Bionic處理器是蘋果首款采用5nm工藝打造移動設(shè)備芯片,晶體管數(shù)量相較于A13 Bionic處理器的7nm芯片增加了近40%,晶體管數(shù)量達(dá)到了驚人的118億顆。

僅憑工藝制程的提升,A14在性能和功耗表現(xiàn)上自然會有一定的提升。官方宣稱,在性能比較上,CPU提升40%,全新GPU構(gòu)架提升30%。不過,讓外界吐槽的是,這一數(shù)據(jù)是A14跟A12比較得出來的。這讓A13情何以堪呢?

而根據(jù)蘋果之前公布的數(shù)據(jù),A13相比A12在CPU和GPU性能上都提高了20%。因此,如果這兩代的處理器性能指標(biāo)測量標(biāo)準(zhǔn)一致的話,則A14的CUP性能僅比A13快了約16%,GPU性能僅比A13提升了約8.3%??梢哉f,如果排除掉5nm工藝本身所帶來的改進(jìn),相對A13來說,A14在CPU和GPU核心本身性能上的提升其實(shí)并不高。

不過,在AI算力上,A14相比A13則有了非常大的提升,從之前的8核NPU直接翻倍提升到16核NPU。根據(jù)蘋果的測試,A14的AI運(yùn)算能力也提升到了11.8萬億次,機(jī)器學(xué)習(xí)速度提升了70%,機(jī)器學(xué)習(xí)加速器則令運(yùn)算速度快達(dá)10倍,將各種機(jī)器學(xué)習(xí)應(yīng)用的性能表現(xiàn)提升至全新水平。

如果留意就會發(fā)現(xiàn),蘋果從A11到A14,每一次在AI運(yùn)算性能上都做了大幅地提升。盡管我們看到蘋果并不總是以AI芯片或者AI智能終端為噱頭來做宣傳,但事實(shí)上蘋果iOS系統(tǒng)上已經(jīng)遍布各種AI應(yīng)用或者功能,對AI算力增長提出了超高的需求;與此同時(shí),安卓陣營高端芯片廠商在AI芯片上面的頻頻發(fā)力,正在縮短甚至追上與蘋果的A系列芯片的差距,這些可能都是構(gòu)成蘋果移動終端芯片的AI算力爆發(fā)式增長的緣由。

從A11到A14,蘋果的AI算力進(jìn)化

2017年,AI已經(jīng)成為大眾熱議的話題。此時(shí)沒有一家終端芯片廠商不是以AI作為產(chǎn)品的新噱頭,但真正能在AI芯片方面拿得出手的廠商也沒有幾家。這一年華為的麒麟970橫空出世,搶到了首發(fā)。10天后,蘋果的A11 Bionic也正式發(fā)布,A11采用10nm工藝制程、六核CPU、自研三核心GPU設(shè)計(jì)。

之所以可以稱為“AI芯片”,就在于A11首次搭載神經(jīng)網(wǎng)絡(luò)引擎處理器單元(Neural Network Processing Unit,NPU),并且在新的神經(jīng)網(wǎng)絡(luò)引擎上蘋果發(fā)布了第一代Core ML,運(yùn)用本地化人工智能加速器進(jìn)行機(jī)器學(xué)習(xí)。

A11搭載的NPU采用雙核設(shè)計(jì),每秒運(yùn)算次數(shù)6000億次,主要處理機(jī)器學(xué)習(xí)任務(wù),能夠識別人物,地點(diǎn)和物體,主要針對的應(yīng)用是iPhone新推出的人臉識別鎖屏FaceID以及人臉關(guān)鍵點(diǎn)追蹤Animoji,且NPU算力并不對第三方應(yīng)用開放。

蘋果A11處理器的標(biāo)志意義,除了成為蘋果自主研發(fā)程度最高的一代處理器之外,其實(shí)也和華為一起真正地打開了移動終端的AI時(shí)代。此后幾乎所有手機(jī)廠商都把AI運(yùn)算能力當(dāng)作宣傳賣點(diǎn)和升級點(diǎn)。

蘋果在2018年推出的A12 Bionic,采用了臺積電當(dāng)時(shí)最新的7nm工藝制程,蘋果自研的Fusion架構(gòu),而神經(jīng)網(wǎng)絡(luò)引擎從雙核直接升級到八核,能夠?qū)崿F(xiàn)每秒5萬億次計(jì)算,比較上一代有了8.3倍的提升。第二代神經(jīng)網(wǎng)絡(luò)引擎才是在算力和性能上能夠?qū)崿F(xiàn)更多AI功能。另外,A12采用了全新的智能HDR算法以及core ML帶來的圖像識別、第三方APP垃圾信息處理等功能,AI應(yīng)用開始普及。

2019年發(fā)布的A13 Bionic處理器,CPU、GPU和NPU的核心數(shù)都與A12相同,只是采用了臺積電升級版7nm工藝,集成85億個晶體管,性能、功耗都有了一定提升,而神經(jīng)網(wǎng)絡(luò)引擎的峰值算力提升到每秒6萬億次計(jì)算,提升幅度并不顯著,同樣是為面容ID、三攝系統(tǒng)、AR類APP等機(jī)器學(xué)習(xí)應(yīng)用提供算力支持。不過值得一提的是,通過在CPU中加入2個機(jī)器學(xué)習(xí)加速器,讓CPU可以達(dá)到每秒1萬億次的矩陣數(shù)學(xué)運(yùn)算。同時(shí),Core ML3可以與機(jī)器學(xué)習(xí)控制器配合,自動為CPU、GPU和NPU分配任務(wù)。

這次發(fā)布的A14處理器芯片上,神經(jīng)引擎核心數(shù)再次翻倍達(dá)到16個,每秒運(yùn)算次數(shù)達(dá)到了驚人的11.8萬億次,機(jī)器學(xué)習(xí)速度提升了70%,機(jī)器學(xué)習(xí)加速器則令運(yùn)算速度快達(dá)10倍,將各種機(jī)器學(xué)習(xí)應(yīng)用的性能表現(xiàn)再次大幅提升。

AI應(yīng)用的“猛虎”,蘋果AI芯片大規(guī)模升級的內(nèi)因

根據(jù)資料,早在2014年,蘋果已經(jīng)在新一代架構(gòu)芯片Soc的開發(fā)中加入專門的AI芯片。而在此之前,蘋果的AI算力是由“CPU+GPU”實(shí)現(xiàn),其自主開發(fā)AI芯片的設(shè)計(jì)思路則是由CPU和GPU處理的AI任務(wù)轉(zhuǎn)向由專門的AI芯片進(jìn)行處理,最終將芯片集成到終端設(shè)備上。

與此同時(shí),隨著蘋果移動終端在拍照攝影、圖形處理等應(yīng)用上面越來越需要用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的算法運(yùn)算,這些需求使得蘋果開始考慮將AI應(yīng)用的運(yùn)算必須采用神經(jīng)引擎這一專門定制的處理器單元來完成這些計(jì)算。

2017年,蘋果的神經(jīng)引擎處理器正式落地。

不過讓外界驚訝的是,為何短短三年之中,A系列芯片的AI算力得到了將近20倍的提升,遠(yuǎn)遠(yuǎn)超出Soc芯片其他處理器的性能提升幅度?

一方面是CPU和GPU的性能,在現(xiàn)有的工藝制程進(jìn)化和既定架構(gòu)的約束上提升已經(jīng)非常困難。隨著半導(dǎo)體工藝從7nm向5nm、3nm工藝升級,難度會越來越大,而可預(yù)期的提升卻可能并不顯著。反而AI加速器還會有相當(dāng)大的設(shè)計(jì)提升空間。

另一方面是,終端應(yīng)用對于動用CPU和GPU的需求正在達(dá)到一個用戶的使用極限,因此也沒有快速增長的需求,但是這些應(yīng)用的AI算力需求則在大幅增長。

如果對蘋果iOS系統(tǒng)中的用到機(jī)器學(xué)習(xí)相關(guān)的功能和應(yīng)用進(jìn)行分析的話,我們看到最新兩代的iPhone和iPad已然是一部各個部分和細(xì)節(jié)都在使用AI的終端了。

在蘋果終端的細(xì)節(jié)體驗(yàn),已經(jīng)有大量機(jī)器學(xué)習(xí)算法的加持,但相應(yīng)的體驗(yàn)難以被用戶察覺。

比如,機(jī)器學(xué)習(xí)用于幫助iPad的軟件區(qū)分用戶在使用Apple Pencil繪圖時(shí)到底是不小心將手掌壓在屏幕上還是有意提供輸入的按壓?;蛘呤窃诒O(jiān)控用戶使用習(xí)慣,以優(yōu)化設(shè)備的電池壽命和充電頻次,既可以改善用戶在兩次充電之間的時(shí)間,又可以保證電池的使用壽命。

還有像iPhone的拍照,用戶每次按下快門,設(shè)備會快速連續(xù)拍攝很多張照片,然后經(jīng)過機(jī)器學(xué)習(xí)訓(xùn)練的算法會分析每個圖像,并將其認(rèn)為是每個圖像的最佳部分合成為一個結(jié)果。也就是iPhone拍照的卓越效果很大程度是靠“計(jì)算”出來的。蘋果正是通過iPhone中對圖像信號處理器(ISP)和神經(jīng)引擎的協(xié)同處理,才使得照片質(zhì)量獲得大幅提升。

蘋果在終端本地大幅提升神經(jīng)引擎的運(yùn)算能力,以及配合圖形計(jì)算引擎和AI加速等功能,可以在移動終端中執(zhí)行非常高難度的機(jī)器學(xué)習(xí)任務(wù)。比如在iPad Pro上,通過神經(jīng)引擎的計(jì)算能力,結(jié)合Project Aero 軟件,iPad Pro 能將 PSD 中創(chuàng)作的每一個圖層以獨(dú)立的 AR 對象呈現(xiàn)在屏幕上,每個圖層都分離成一幕栩栩如生的景觀,這對創(chuàng)作者來說相當(dāng)具有吸引力。

此外,蘋果已經(jīng)加入的顯著的AI新功能,諸如機(jī)器學(xué)習(xí)在翻譯、內(nèi)置聽寫、輸入預(yù)測、健康特性分析與預(yù)測上面,都需要大量的機(jī)器學(xué)習(xí)參與。

而蘋果選擇在機(jī)器學(xué)習(xí)任務(wù)的本地化計(jì)算的另一大原因,可能是為了將數(shù)據(jù)留在本地,用以保護(hù)用戶隱私。我們知道,機(jī)器學(xué)習(xí)的本質(zhì)就是對海量數(shù)據(jù)進(jìn)行學(xué)習(xí),而數(shù)據(jù)的采集和分析一直是谷歌、facebook這些互聯(lián)網(wǎng)公司的“原罪”,作為承諾嚴(yán)格遵守用戶隱私數(shù)據(jù)保護(hù)的蘋果,自然要做出保證,盡量將機(jī)器學(xué)習(xí)算法所需要的用戶數(shù)據(jù)留在用戶的移動終端當(dāng)中,但與此同時(shí)要保證AI算法的有效,就必須對終端芯片的AI算力引擎做出大幅提升。

當(dāng)然,蘋果自身終端系統(tǒng)對于AI算力升級的要求,只是一只內(nèi)生的吞噬算力的“猛虎”,在外部競爭中,蘋果還要面對一群實(shí)力強(qiáng)勁的“追龍”,在AI算力提升上不斷地應(yīng)戰(zhàn)。

安卓陣營的“追龍”,蘋果AI算力快速升級的外因

蘋果自研的A系列處理器芯片,一直以來以創(chuàng)新和高性能著稱,雖然最近兩年,安卓系的高端芯片,諸如高通的驍龍芯片、聯(lián)發(fā)科Helio芯片、華為海思的麒麟芯片則大有追趕之勢。

如果拋去綜合性能的討論,但是在AI芯片算力上面,高通的驍龍?zhí)幚砥髟谛阅苌虾蛿?shù)量上都已經(jīng)有超過蘋果A系列芯片的可能。

比如在2019年上半年手機(jī)AI芯片排行榜上,排名前十的智能手機(jī)AI芯片,其中前四名分別是高通驍龍855、蘋果A12 Bionic、聯(lián)發(fā)科Helio P90和海思麒麟980。但值得關(guān)注的是,除了第二、三、四名,這份榜單中的其他位置都被高通驍龍芯片占據(jù)。

與蘋果采取專用NPU芯片來提供AI算力不同的是,高通的驍龍?zhí)幚砥鞑捎昧水悩?gòu)計(jì)算的方式,推出了自研的AI引擎,通過CPU、GPU和DSP(Hexagon處理器)組合相互配合,運(yùn)行神經(jīng)網(wǎng)絡(luò)計(jì)算的效率,根據(jù)不同的應(yīng)用場景來安排工作負(fù)載。

而預(yù)計(jì)在今年年底發(fā)布的高通驍龍875,同樣采用了5nm制程工藝,與7nm相比邏輯密度提高80%,其基礎(chǔ)性能較上代提升15%,功耗降低30%。非常激進(jìn)的是,高通這次采用了ARM的Cortex X1超大核心設(shè)計(jì),為“1+3+4”八核心三簇設(shè)計(jì)模式,其中1為Cortex X1超大核心,3為大核,采用Cortex A78,4為能效核心。據(jù)業(yè)界的預(yù)測,驍龍875無論在綜合性能還是在AI算力上都有超越A14的可能。

此外,高通通過AI引擎的的高、中端芯片布局,與不同的軟硬件企業(yè)一起,從底層框架、硬件核心、軟件等層面,將AI能力應(yīng)用到了海量的移動終端和智能設(shè)備上,形成基于AI應(yīng)用的合作生態(tài)。

高通在AI算力上的激進(jìn)演化以及在AI能力上的不斷賦能,已經(jīng)開始形成對于蘋果的A系列芯片領(lǐng)導(dǎo)力的巨大威脅。在面臨安卓陣營這些“追龍”對手如此“給力”的努力下,蘋果自然也會有強(qiáng)大的外部動力來大幅升級自身的性能優(yōu)勢。就像驍龍875這樣的性能怪獸的出現(xiàn),始終會追在蘋果身后,準(zhǔn)備吊打蘋果。

反過來看蘋果,其NPU的性能升級戰(zhàn)略也并未顯露頹勢。根據(jù)專業(yè)人士的說法,目前,蘋果A系列芯片上NPU占芯片總面積約為5%,未來NPU的面積能夠達(dá)到類似GPU占有的20%的面積的程度,AI算力至少還有4倍的提升空間,此外還有提升算法和芯片之間的協(xié)同設(shè)計(jì),同時(shí)通過Core ML的進(jìn)化來加強(qiáng)不同AI模型的異構(gòu)設(shè)計(jì),同樣可以發(fā)揮其他SoC芯片部分的潛在算力??傮w來說,蘋果在AI算力的提升上面還有巨大的增長空間。

我們看到,蘋果和安卓陣營在高端芯片廠商在芯片性能的升級,正在從CPU所引領(lǐng)的摩爾定律的賽場轉(zhuǎn)向以AI算力增長為代表的新賽道上。而從AI算力的增長潛力來看,這一升級戰(zhàn)在未來幾年會更趨激烈。

然而最可惜的是,這場終端芯片AI角逐賽里,未來會缺席一位來自中國的實(shí)力選手。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-09-22
蘋果A系列芯片的三年AI進(jìn)化:為何要大規(guī)模升級AI算力?
2019年發(fā)布的A13 Bionic處理器,CPU、GPU和NPU的核心數(shù)都與A12相同,只是采用了臺積電升級版7nm工藝,集成85億個晶體管,性能、功耗都有了一定提升,而神經(jīng)網(wǎng)絡(luò)引擎的峰值算力提升…

長按掃碼 閱讀全文