(源初/文)2023年,全球芯片行業(yè)繼續(xù)保持增長態(tài)勢,根據(jù)國際半導(dǎo)體產(chǎn)業(yè)協(xié)會(huì)預(yù)測,2023年全球半導(dǎo)體銷售額將達(dá)到6860億美元,同比增長10.1%,5G、云計(jì)算、人工智能等新興應(yīng)用的快速發(fā)展,推動(dòng)了芯片需求的增長。
而要說2023年芯片領(lǐng)域什么最熱,故事還要從年初的ChatGPT開始,黃仁勛當(dāng)時(shí)表示:“我們正處于AI的‘ iPhone 時(shí)刻’?!背删蜕墒?a href="http://ygpos.cn/AI_1.html" target="_blank" class="keylink">AI的背后,自然是AI算力的支持。
“iPhone時(shí)刻”引爆芯片需求
2023年3月,英偉達(dá)宣布推出全新的H100 NVL計(jì)算加速卡,專為大型語言模型訓(xùn)練(LLM)設(shè)計(jì),性能更強(qiáng)。其搭載了兩個(gè)基于Hopper架構(gòu)的H100芯片,頂部配備了三個(gè)NVLink連接器,在服務(wù)器里使用了兩個(gè)相鄰的PCIe全長插槽。H100 NVL計(jì)算卡的FP64計(jì)算性能為134TFLOPS,TF32計(jì)算性能為1979 TFLOPS,F(xiàn)P8計(jì)算性能為7916 TFLOPS,INT8計(jì)算性能為7916 TFLOPS,是H100 SXM的兩倍。其具有完整的6144位顯存接口,顯存速率可達(dá)5.1Gbps,意味著最大吞吐量為7.8TB/s,是H100 SM3的兩倍多。
年底,英特爾CEO 基辛格首次公開介紹第三代英特爾AI加速器Gaudi 3,它用于深度學(xué)習(xí)和大型生成式AI模型。英特爾計(jì)劃明年發(fā)布Gaudi 3,稱Gaudi 3的性能將優(yōu)于英偉達(dá)的主打AI芯片H100。據(jù)悉,Gaudi 3將于2024年推出,采用5nm制程,相較前代提供到達(dá)4倍的BFloat16 功能、2 倍的運(yùn)算能力、1.5倍的網(wǎng)絡(luò)頻寬和1.5倍的HBM容量。
AMD也在年底正式發(fā)布兩款A(yù)I芯片旗艦產(chǎn)品,Instinct MI300X與MI300A。MI300X專為生成式AI智能算力設(shè)計(jì)的數(shù)據(jù)中心GPU,正面對標(biāo)英偉達(dá)H100;MI300A則是專為超級計(jì)算機(jī)設(shè)計(jì)的APU產(chǎn)品。APU為AMD在2011年提出的升級版CPU概念,其將CPU和GPU組合在同一個(gè)晶片上,以滿足超級計(jì)算機(jī)高性能計(jì)算的要求。
端側(cè)AI卷起來
端側(cè)AI的概念也開始興起。今年5月,高通在線上發(fā)布了《混合AI是AI的未來》白皮書,梳理了高通在AI領(lǐng)域技術(shù)發(fā)展和應(yīng)用趨勢方面的洞察,旨在與更多合作伙伴共同探索AI技術(shù)普惠之路。通過終端側(cè)AI算力與云端的結(jié)合,恰恰能夠解決目前生成式AI完全依靠云端而出現(xiàn)的各種隱憂。例如在功耗方面,如果在云端運(yùn)行一個(gè)超過10億參數(shù)的生成式AI模型,可能需要數(shù)百瓦功耗的話,但在終端側(cè)運(yùn)行需要的功耗僅有幾毫瓦。
高通在今年巴展期間所帶來的Stable Diffusion在Android終端上的演示為例,能夠在15秒內(nèi)完成20步推理,生成包含細(xì)節(jié)的圖像,整個(gè)過程全部在本地化進(jìn)行,即使手機(jī)設(shè)置成飛行模式,也能完成根據(jù)文字描述所進(jìn)行的繪畫創(chuàng)作任務(wù)。這種特性既為用戶帶來了更加靈活高效的使用方式,又大大提升了隱私保護(hù)性。
驍龍峰會(huì)期間發(fā)布的第三代驍龍8移動(dòng)平臺,NPU提升高達(dá)98%,能效提升40%。在AI表現(xiàn)上可實(shí)現(xiàn)本地運(yùn)行100億參數(shù)的模型,面向70億參數(shù)大語言模型每秒生成高達(dá)20個(gè)token,實(shí)際應(yīng)用中可在本地實(shí)現(xiàn)一秒內(nèi)完成Stable Diffusion的圖片生成。同期發(fā)布的面向移動(dòng)PC領(lǐng)域的驍龍X Elite,CPU+GPU+NPU結(jié)合而成的AI算力更是高達(dá)75TOPS,其中NPU算力高達(dá)45TOPS,AI處理速度是競品的4.5倍。
年底,英特爾在以“AI Everywhere”為主題的活動(dòng)中發(fā)布酷睿Ultra移動(dòng)處理器,英特爾為新CPU配備NPU提供“低功耗人工智能加速和CPU/GPU卸載”,專為在低功耗下長時(shí)間運(yùn)行的AI工作負(fù)載而設(shè)計(jì),與CPU 和GPU的AI功能相輔相成,與前代相比,能夠帶來2.5倍的能效表現(xiàn),能夠執(zhí)行人工智能驅(qū)動(dòng)的任務(wù),如背景模糊、眼動(dòng)追蹤和圖片框架等。
聯(lián)發(fā)科的9300同樣搭載了基于硬件的生成式 AI 引擎,生成式 AI transformer 運(yùn)算速度快 8 倍,2 倍整數(shù)和浮點(diǎn)運(yùn)算速度,功耗較前一代降低 45%,最高可支持 330 億參數(shù)的 AI 大語言模型,支持 NeuroPilot Compression 內(nèi)存硬件壓縮技術(shù),生成式 AI 端側(cè)技能擴(kuò)充技術(shù)。
3nm終于來了
相比于去年A16處理器的小修小補(bǔ),蘋果伴隨iPhone 15 Pro系列推出的A17 Pro終于迎來臺積電3nm制程,擁有高達(dá)170億個(gè)晶體管,也成為了業(yè)界首款搭載3nm制程芯片的系列手機(jī)。A17 Pro芯片硬件加速光線追蹤的運(yùn)行速度提升最高可達(dá)4倍,神經(jīng)網(wǎng)絡(luò)引擎運(yùn)行機(jī)器學(xué)習(xí)模型的速度提升最快可達(dá)2倍,每秒可執(zhí)行最高達(dá)35萬億次操作。
根據(jù)臺積電給出的數(shù)據(jù)顯示,3nm制程的邏輯密度將增加約70%,相同功耗下,速度提升10~15%,或于相同速度下,功耗降低25~30%。不過,臺積電3nm制程對于iPhone所帶來的使用體驗(yàn)提升并不明顯??紤]到機(jī)身設(shè)計(jì)問題,也為iPhone 15 Pro系列帶來了散熱問題。
10月底,蘋果再次伴隨新款Macbook Pro系列發(fā)布采用3nm制程的M3系列芯片。蘋果表示M3在CPU性能上比M1快了35%。M3還配備了采用下一代架構(gòu)的10核GPU,圖形性能比M1快65%。M3還支持高達(dá) 24G B 的統(tǒng)一內(nèi)存和一臺外接顯示器。M3 Pro在單線程任務(wù)中,CPU性能比M1 Pro快30%。M3 Pro最高支持36GB統(tǒng)一內(nèi)存。M3 Max擁有920億個(gè)晶體管和16核GPU,包括12個(gè)性能核心和4個(gè)效率核心,以及40核GPU,比M1 Max快50%。M3 Max最高支持128GB統(tǒng)一內(nèi)存。M3 Max的GPU性能比M1 Max快80%。
展望2024年,全球芯片行業(yè)仍將保持增長態(tài)勢。 云計(jì)算、人工智能等新興應(yīng)用的快速發(fā)展,將繼續(xù)推動(dòng)高性能芯片的需求。預(yù)計(jì)在2024年,云計(jì)算、人工智能芯片的市場規(guī)模將達(dá)到3000億美元,同比增長15%。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 中國電信再次出讓三家金融機(jī)構(gòu)股權(quán) 價(jià)值規(guī)模近10億
- 中國移動(dòng)無源器件產(chǎn)品集采:規(guī)模為1807.93萬件
- 中國移動(dòng)分天線產(chǎn)品集采:規(guī)模為1588.82萬面
- 訊飛中標(biāo)沈陽市大東區(qū)人工智能大模型項(xiàng)目
- 中國衛(wèi)通集團(tuán)轉(zhuǎn)讓中衛(wèi)普信20%股權(quán)
- 中國移動(dòng)5G大功率(2.6G單頻)直放站設(shè)備集采:京信、銳捷等6家中標(biāo)
- 天翼云擊敗聯(lián)通數(shù)科,中標(biāo)天津軌道云項(xiàng)目
- 相愛相殺:三大運(yùn)營商聯(lián)合中標(biāo)山西省電子政務(wù)外網(wǎng)項(xiàng)目
- 北京聯(lián)通中標(biāo)中信信托機(jī)柜租賃采購項(xiàng)目
- 中國聯(lián)通11月5G套餐用戶凈增127.8萬戶
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。