0.6秒!手機跑Stable Diffusion創(chuàng)下最快速度,而這僅僅是開始

導語:如今,隨著將大模型塞進手機的進程加快,普通用戶也能親自體驗生成式AI的魅力了。

2023 已經(jīng)行至尾聲,這一年大模型和生成式 AI成為人工智能圈的主流趨勢。自ChatGPT 出現(xiàn)以來,各式各樣通用、專業(yè)的 AI 大模型層出不窮,噴涌之勢已經(jīng)不可阻擋。隨著量化、網(wǎng)絡(luò)剪枝和知識蒸餾等模型壓縮技術(shù)進步,手機等終端設(shè)備AI算力持續(xù)增強,大模型在云端部署之外正在向終端落地邁進。

圖片1.jpg

對于這場已經(jīng)拉開了序幕的「終端側(cè)革命」,芯片巨頭和手機廠商們成為主力軍,他們不斷嘗試在手機等終端設(shè)備上部署運行生成式AI大模型,時不時給人們一點小小的驚喜和震撼。

今年2月,我們第一次看到了在手機上運行超過10 億參數(shù)的文生圖大模型Stable Diffusion。那是在一部搭載高通第二代驍龍 8移動平臺的安卓手機上運行的,不到15秒的時間執(zhí)行20步推理,生成了一張512×512像素的圖像。這也創(chuàng)造了當時智能手機上最快的推理速度。

你以為這就是手機運行Stable Diffusion的速度極限了嗎?顯然不是。在上個月舉行的2023驍龍技術(shù)峰會上,不到15秒的生成時間又被整整縮短數(shù)十倍。高通最新旗艦移動平臺第三代驍龍8(以下簡稱驍龍8 Gen 3)讓速度飛升成為可能。

在峰會現(xiàn)場,高通用搭載了驍龍 8 Gen 3的手機運行相同的Stable Diffusion大模型,這次不到1秒(0.6秒)的時間便在本地生成了一張圖像。從15秒到0.6秒,終端側(cè)生成式AI大模型的進化速度讓我們驚嘆不已。

這只是高通在本屆驍龍技術(shù)峰會上展示其終端側(cè)AI能力的牛刀小試。除了生成速度(從 15 秒到 0.6秒)有了質(zhì)的飛躍,驍龍8 Gen 3將支持運行的大模型參數(shù)規(guī)模(從10億到百億)提升一個量級。

大模型賦能平臺也不再局限于手機,高通下一代 AI PC 芯片驍龍X Elite亮相,將百億參數(shù)大模型「塞進」PC平臺,極大拓展了生成式AI應(yīng)用的廣度。

至此,高通在終端側(cè)AI領(lǐng)域積累起來的領(lǐng)導力和技術(shù)領(lǐng)先性進一步得到加強,更賦予了手機、PC,甚至耳機等廠商更多終端AI落地的想象力和可能性。

雙平臺并進,讓生成式AI更加觸手可及

自今年2月以來,高通先后在搭載第二代驍龍8移動平臺的安卓手機上運行Stable Diffusion、ControlNet,讓大模型跑在手機端成為現(xiàn)實。此次驍龍峰會上發(fā)布的驍龍 8 Gen 3 將大模型終端側(cè)落地的潛力提升到了新的高度,使其自身繼續(xù)在該領(lǐng)域引領(lǐng)潮流。

據(jù)了解,驍龍8 Gen 3采用的高通AI引擎擁有面向移動終端的強大Hexagon NPU,集成了升級后的硬件加速單元、微切片推理單元、加強張量、標量和矢量單元,所有單元共享 2 倍帶寬的大容量共享內(nèi)存。同時支持 INT8+INT16的混合精度以及 INT4、INT8、INT16和FP16的所有精度。性能較前代提升98%,能效提升40%。

驍龍 8 Gen 3 集成的高通傳感器中樞也更強,擁有2個始終感應(yīng)ISP、2個micro NPU和1個DPS,內(nèi)存增加了30%,支持INT4精度,AI性能提升了3.5倍。

圖片5.jpg

可以說,驍龍 8 Gen 3賦予了手機前所未有的強大終端側(cè)AI性能,成為高通首個專為生成式AI打造的移動平臺。那么這款旗艦級移動平臺是否名副其實呢?這是我們大家最為關(guān)心的問題。

在該平臺上,高通AI引擎首次支持多模態(tài)生成式AI,包括了多種大語言模型、視覺語言模型等。尤其是在終端側(cè),驍龍8 Gen 3 首次支持運行 100億參數(shù)的模型,規(guī)模邁入百億量級。同時將 Stable Diffusion 生成圖像的時間降到了1秒之內(nèi),再次創(chuàng)下最快速度。

在跑Meta大語言模型Llama2-7B時,驍龍8 Gen 3每秒可以生成20個token,同樣是手機終端側(cè)最快之一。

圖片6.jpg

(圖注)高通產(chǎn)品管理高級副總裁Ziad Asghar

驍龍平臺已經(jīng)支持運行OpenAI、Meta、微軟、安卓、stability.ai、BLOOM、百度、智譜、百川智能、有道等企業(yè)或機構(gòu)的大模型,既為這些廠商將自身大模型能力「下放」到終端側(cè)提供契機,也為用戶體驗生成式AI帶來了豐富的選擇項。

牽一發(fā)而動全身,隨著高通在賦能大模型終端落地上的進一步動作,采用驍龍 8 Gen 3移動平臺的手機廠商快速跟進,加速了大模型集成到手機的進程。

以首發(fā)搭載驍龍 8 Gen 3移動平臺的小米14系列新機為例,AI大模型技術(shù)已經(jīng)集成到小米全新澎湃 OS 中,并上線各種終端側(cè)應(yīng)用。有了大模型能力加持,小米14 支持了 AI 妙畫、AI搜圖、AI寫真、AI擴圖等多項功能,讓輸入法、WPS、相冊煥發(fā)新的活力。

vivo旗下品牌iQOO 12系列同樣搭載了驍龍8 Gen 3移動平臺,全新高通AI引擎使其影像體驗大幅升級,照片質(zhì)感和細節(jié)拉滿。同時該系列手機預裝的 OriginOS 4系統(tǒng)引入生成式AI功能,AI助手藍心小V可以進行超能語義搜索、超能問答、超能寫作、超能創(chuàng)圖、超能智慧交互,智能化程度明顯提升。

此前在驍龍峰會上,榮耀CEO趙明宣布新旗艦手機榮耀Magic 6將搭載驍龍8 Gen 3移動平臺,已支持70億參數(shù)的終端側(cè)AI大模型,為用戶提供更加智能化的體驗。他在現(xiàn)場演示了終端側(cè)AI進行照片搜索、生成視頻等智能操作,效果著實不錯。

手機終端融合大模型能力催生了大量或好玩、或有助于提升生產(chǎn)力的生成式 AI應(yīng)用。未來更加豐富的生成式AI應(yīng)用會讓更多用戶切身體驗到 AI的魅力,提升自身交互體驗,這也正是高通致力于在終端側(cè)打造生成式AI能力的重要源動力之一。

在持續(xù)利用AI賦能手機移動平臺之外,高通也在尋求利用并把握好大模型及生成式AI的發(fā)展契機,以此來重塑PC行業(yè),擴大自身在AI領(lǐng)域的領(lǐng)先優(yōu)勢。

生成式AI有了「第二陣地」

高通發(fā)布了面向PC 平臺的全新處理器驍龍X Elite,它采用4nm制程工藝,集成定制的高通Oryon CPU,運行速度是英特爾 12 核處理器的 2倍,功耗比英特爾競品低68%,高峰時段的運行速度比蘋果M2快了50%。

如果這些參數(shù)還無法讓你相信驍龍X Elite的強悍,那就跑個分吧。驍龍 X Elite 擁有兩個版本:注重續(xù)航表現(xiàn)的 23W 版本、主打性能的 80W版本。Geekbench 6測試下的單核和多核得分情況如下圖所示,單核性能尤為亮眼。

圖片10.jpg

(圖注)圖源fonearena

同樣地,驍龍X Elite專為AI打造。它采用業(yè)界領(lǐng)先的、集成高通Hexagon NPU的高通AI引擎,異構(gòu)算力高達75TOPS,Hexagon NPU算力為45TOPS,為創(chuàng)意應(yīng)用、視頻會議和生產(chǎn)力助手的變革性體驗提供了算力基礎(chǔ)。高通 AI引擎還支持了大量的加速應(yīng)用程序和體驗,創(chuàng)造無限可能性。

超強生成式 AI 能力也成為驍龍X Elite的一大標簽,截止到發(fā)布時,它已支持在端側(cè)運行超過130億參數(shù)的生成式AI模型,面向70億參數(shù)大模型每秒生成30個token,AI處理速度是競品的4.5倍。下圖為PC端AI作畫能力的展示。

從手機到 PC,多樣化的端側(cè)平臺為釋放生成式 AI能力提供了更多渠道。這也表明,高通在終端側(cè)生成式AI落地這條賽道上繼續(xù)「加碼」,背后既離不開技術(shù)上的厚積薄發(fā),也是其在大模型時代自身AI發(fā)展戰(zhàn)略的延續(xù)。

手機、PC加速迎來全新AI時代

在當今大模型時代,終端側(cè)部署生成式AI這條路線越來越明晰?;诖?,高通秉持「混合AI是AI的未來」這一理念和戰(zhàn)略,注重云端與終端的協(xié)同發(fā)展,并認為終端側(cè)AI是擴展生成式AI至全球更廣泛范圍的關(guān)鍵。

遵循這一前瞻性認知,高通一步步積累,逐漸在自身布局中構(gòu)建了強大、全面的終端側(cè)AI能力,并引領(lǐng)了端側(cè)大模型及生成式AI的革新與進步。毫無疑問,此次驍龍峰會上發(fā)布的驍龍 8 Gen 3、驍龍X Elite將進一步夯實高通作為終端側(cè)AI領(lǐng)導者的地位。

圖片12.jpg

(圖注)高通全棧AI優(yōu)化方案

如果大模型繼續(xù)保持當前的落地步伐,我們將可以在手機、PC 甚至XR可穿戴設(shè)備、智能網(wǎng)聯(lián)汽車等智能終端上體驗到更多生成式AI應(yīng)用,讓人機交互更加自然且個性化。反過來,這些生成式AI應(yīng)用以及帶來的體驗變革也將對這些終端設(shè)備產(chǎn)生深遠影響,甚至改變它們的核心驅(qū)動力,重新定義它們。

我們以與人們?nèi)粘9ぷ?、生活息息相關(guān)的手機為例,在追求絕對性能之外,人們越來越多地關(guān)注一些創(chuàng)意性應(yīng)用。這就需要AI大顯身手,生成式AI性能更是成為下一代手機處理器角逐的核心競爭力。

驍龍移動平臺近年來持續(xù)發(fā)力于此也在意料之中了。從去年的驍龍8 Gen 2 到此次驍龍峰會上的驍龍 8 Gen 3,AI 早已無處不在,生成式 AI 一躍成為「AI 皇冠上的新明珠」,受到了廣泛關(guān)注和青睞。

隨著大模型及生成式AI在手機終端落地的范圍越來越廣、成熟度越來越高,我們或許可以看到:傳統(tǒng)智能手機被生成式 AI 能力全方位加持的「AI 手機」所取代。小米等手機廠商新發(fā)布的旗艦機在這方面已經(jīng)初具雛形,利用生成式AI增強一些場景的使用體驗和效率,為未來顛覆手機的質(zhì)變做好了充分的量變。

同時,PC 終端的革新也有類似向生成式 AI 能力傾斜的發(fā)展趨勢。在這方面,集成到Windows 中的微軟 Copilot是一個很好的例證。當然還有更多生成式AI變革人類與 PC 交互的場景和方式,借此實現(xiàn)更高效的智能協(xié)作、更簡化的工作流程、更強大的生產(chǎn)力、更定制化的使用體驗。

驍龍 X Elite 一出手便瞄準生成式 AI,勢必會為當前的PC市場注入新鮮血液。在第六屆虹橋國際經(jīng)濟論壇 ——「智能科技與未來產(chǎn)業(yè)發(fā)展」分論壇上,高通公司中國區(qū)董事長孟樸發(fā)表了主題演講,認為下一代 PC 將進入一個全新的「AI PC」時代,以智能、高性能、高效等為特點, 并將對辦公效率等方面產(chǎn)生重要意義。

相信未來高通會在驍龍 8 Gen 3 等移動平臺和驍龍 X Elite等PC平臺的基礎(chǔ)上,繼續(xù)加強自身在大模型和生成式AI上的基礎(chǔ)能力。加之更多搭載這些平臺的廠商發(fā)布全新旗艦手機和 PC 產(chǎn)品,他們不斷增強的自主性及自研能力可以讓我們期待更多樣化生成式AI應(yīng)用的亮相。

不過,在「AI 手機」和「AI PC 時代」真正到來之前,還要看生成式AI能力是否能讓用戶產(chǎn)生強烈感知、是否能準確滿足他們的需求、是否能對相關(guān)應(yīng)用產(chǎn)生依賴性、以及是否能帶動他們換機的欲望,這些都是高通和手機廠商現(xiàn)在及未來要考慮的問題。

結(jié)語

自發(fā)布以來,驍龍 8 Gen 3、驍龍X Elite展現(xiàn)出的強大生成式AI能力留給人們無限的想象空間。 正如高通公司總裁兼 CEO 安蒙所言,「我們正在進入將改變用戶體驗的生成式AI時代,也將創(chuàng)造一個移動行業(yè)和計算行業(yè)的全新周期。」

在這一進程中,作為終端側(cè)領(lǐng)導者的高通正擔負起應(yīng)有的時代角色。一方面,利用自身強大的全棧AI優(yōu)化能力匯聚軟硬件各方,助力終端側(cè)AI生態(tài)快速發(fā)展;另一方面,全新的跨平臺技術(shù)「Snapdragon Seamless」實現(xiàn)安卓、Windows 和其他操作系統(tǒng)無縫銜接,這種多終端體驗有望將 AI在手機、PC 等終端上的落地進一步拓展開來。

可以預見,基于驍龍生態(tài)的AI體驗會非常快速鋪展開來,各種應(yīng)用落地的速度也將大大加快。未來,高通將繼續(xù)保持自身在終端側(cè)AI的技術(shù)優(yōu)勢,推動大模型在部署應(yīng)用時更便捷、更豐富、更有吸引力。同時,攜手各大廠商創(chuàng)新基于大模型的生成式AI應(yīng)用,降低普通用戶使用生成式AI的門檻。

隨著新的生成式AI時代開啟,高通是否能持續(xù)滿足人們的期待,我想這次驍龍峰會已經(jīng)給了我們答案。

(文章轉(zhuǎn)載自機器之心公眾號)

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )