天璣9300支持內(nèi)存硬件壓縮技術(shù),行業(yè)第一,讓手機運行AI大模型更快速

聯(lián)發(fā)科最新發(fā)布的一代旗艦級5G生成式AI移動芯片天璣9300,其創(chuàng)新的全大核架構(gòu)設(shè)計與最新的AI處理器APU等聯(lián)發(fā)科特色技術(shù)的合并,為生成式AI應(yīng)用提供了強大的動力,以實現(xiàn)引人入勝、豐富多樣的生成式AI體驗。同時,聯(lián)發(fā)科也與大量的AI企業(yè)在業(yè)內(nèi)進行深入合作,共同在移動平臺上構(gòu)造了一個充滿活力的AI生態(tài)。

全新第七代AI處理器APU 790,為生成式AI而生

隨著用戶對生成式AI應(yīng)用需求日益增長,端側(cè)生成式AI便捷、安全性等優(yōu)勢便凸顯出來。當(dāng)然,部署端側(cè)AI大語言模型需要強大的AI算力支撐。

天璣9300搭載聯(lián)發(fā)科第七代AI處理器APU 790,為生成式AI而設(shè)計,擁有硬件級的生成式AI引擎,可以實現(xiàn)更加高速且安全的邊緣AI計算,深度適配Transformer模型進行算子加速,速度是上一代的8倍。

同時APU 790的性能和能效得到顯著提升,整數(shù)運算和浮點運算能力提升至前一代的2倍,蘇黎世ETHZv5.1 AI-Benchmark Mobile Soc跑分2109 分,AI性能成功霸榜,功耗更是降低了45%。在強大的AI性能支持下,1秒以內(nèi)即可生成圖片。天璣9300強悍的AI算力、創(chuàng)新的全大核CPU架構(gòu)和Immortalis-G720 GPU都為端側(cè)運行生成式AI打下堅實的性能基礎(chǔ)。

同時,基于億級參數(shù)大語言模型的特性,聯(lián)發(fā)科開發(fā)了混合精度 INT4 量化技術(shù),結(jié)合聯(lián)發(fā)科特有的內(nèi)存硬件壓縮技術(shù)NeuroPilot Compression,可以更高效地利用內(nèi)存帶寬,大幅減少AI大模型占用終端內(nèi)存,為端側(cè)運行AI大語言模型突破手機內(nèi)存限制,助力更大參數(shù)模型在端側(cè)落地。

基于以上,天璣9300首次在vivo旗艦手機端側(cè)落地70億參數(shù)AI大語言模型,處理速度可達20 Tokens每秒。不僅如此,聯(lián)發(fā)科突破了行業(yè)極限,已經(jīng)與vivo成功在端側(cè)運行了130億參數(shù)的大語言模型。甚至,天璣9300已率先實現(xiàn)在移動芯片上成功運行330億參數(shù)的AI大語言模型,領(lǐng)跑業(yè)界。

天璣9300還支持多模態(tài)生成式AI大模型,打造出“文生詩”“文生圖”“文生趣圖”等豐富有趣的端側(cè)體驗。

可見,天璣9300的AI算力和端側(cè)生成式AI能力已領(lǐng)先行業(yè),足以讓用戶隨時隨地AI創(chuàng)造力全飆。

生成式AI模型端側(cè)技能擴充,帶來全面、豐富的端側(cè)生成式AI體驗

與云側(cè)生成式AI解決方案不同,由于硬件環(huán)境的差異,部署端側(cè)生成式AI也需要考慮手機內(nèi)存、存儲容量、負載上限等因素。為此,聯(lián)發(fā)科率先提出了先進的解決方案。

APU 790 支持生成式AI模型端側(cè)技能擴充技術(shù)NeuroPilot Fusion,它可以基于基礎(chǔ)大模型持續(xù)在端側(cè)進行低秩自適應(yīng)(LoRA,Low-Rank Adaptation)融合,在混合式AI的賦能下,可以基于1個基礎(chǔ)大模型,通過云端訓(xùn)練,在端側(cè)完成N個功能的融合,賦予基礎(chǔ)大模型更全面、更豐富的生成式AI應(yīng)用能力。

比如基于AI模型端側(cè)技能擴充技術(shù)的“圖生GIF動圖”功能,用戶可以根據(jù)一張照片更換不同的風(fēng)格甚至表情,玩出個人專屬風(fēng)格的表情包,秒變表情包小達人。

AI開發(fā)平臺NeuroPilot加速端側(cè)生成式AI生態(tài)布局

基于強大的AI算力和先進的內(nèi)存硬件壓縮技術(shù)、AI模型端側(cè)技能擴充等技術(shù),天璣9300的APU 790將端側(cè)生成式AI的速度和廣度提升到了全新的水平。同時,為加速生成式AI在端側(cè)部署和普及,聯(lián)發(fā)科也憑借其AI開發(fā)平臺NeuroPilot構(gòu)建了豐富的AI生態(tài),從底層硬件到工具鏈、模型中心以及開發(fā)生態(tài),助力生態(tài)快速、高效地部署端側(cè)生成式AI應(yīng)用。

AI開發(fā)平臺NeuroPilot支持Android、Meta LIama 2、百度文心一言大模型、百川智能百川大模型等前沿主流AI大模型。

更為重要的是,NeuroPilot擁有一套完整且先進的工具鏈,除了NeuroPilot Compression低秩自適應(yīng)融合,還有Speculative Decoding推測解碼加速和模型優(yōu)化與轉(zhuǎn)化技術(shù)。

聯(lián)發(fā)科的天璣開發(fā)者中心還可提供端側(cè)生成式AI落地一站式開發(fā)者資源,分享端側(cè)模型部署案例提升開發(fā)效率。目前已有20多個生成式AI合作伙伴加入生態(tài)共建。

聯(lián)發(fā)科還攜手業(yè)界合同伙伴打造精彩的生成式AI應(yīng)用體驗。虹軟的生成式AI超級分辨率技術(shù)基于天璣9300 APU 邊緣計算能力,相比前代,性能可提升30%。在25倍放大的拍攝時,利用生成式AI超級分辨率技術(shù),可以拍出細節(jié)更真實的圖像效果。

極感科技的生成式AI語意搜索技術(shù)也基于天璣9300 APU邊緣計算能力,對比前代,性能可提升260%。比如在手機的相冊中搜索照片,描述照片的內(nèi)容即可在毫秒內(nèi)精準(zhǔn)搜到對應(yīng)的照片。而且在斷網(wǎng)狀態(tài)下也能搜索,隱私也不會泄露。

QQ圖片20231109125729.png

QQ圖片20231109125729.png

Morpho的視頻通話實時數(shù)字分身生成技術(shù),同樣基于天璣9300 APU邊緣計算能力,對比前代,性能提升26%。一般的虛擬人像生成器需手動選取容貌樣式花費時間。但基于視頻通話實時數(shù)字分身生成技術(shù),用戶操作容易,僅需打開攝像頭單幀圖片即可瞬間生成數(shù)字分身。

QQ圖片20231109125729.png

基于天璣9300 APU邊緣計算能力,慧鯉生成式AI防眩光技術(shù)性能可提升60%。在此技術(shù)加持下,無論是室外還是室內(nèi),在拍攝時如有眩光,只要輕松一暗即可消除眩光干擾。

QQ圖片20231109125729.png

可以看到,在AI端云融合的趨勢下,天璣9300在AI算力、生成式AI用戶體驗和生態(tài)方面展現(xiàn)出全面的優(yōu)勢,為新一代旗艦級端側(cè)生成式AI體驗樹立了新的標(biāo)桿,強大生成式AI就要用天璣。

同時,聯(lián)發(fā)科等生成式AI的領(lǐng)先者們正通過不斷地技術(shù)革新和適當(dāng)?shù)纳鷳B(tài)布局,大力推動混合式AI計算,并為端側(cè)生成式AI部署設(shè)計出了一套獨自且高效的方法,全力以赴推進生成式AI在端側(cè)的普及,旨在讓更多的用戶享受到端側(cè)AI的個性化服務(wù),帶來全新的全方位智能體驗,實現(xiàn)科技成果惠及全社會。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )