手機的下一個突破口,AI能否帶來新飛躍

(魏德齡/文)隨著ChatGPT的風靡,讓很多人發(fā)現(xiàn)AI離自己如此之近,流暢的外文翻譯、包含從1-4的簡單小作文,一下讓AI從只聞其聲,不見其影的高科技,變身為觸手可及的生活小助手。

其實AI在手機上的應用并非什么新鮮事,很多年前當用戶打開攝像頭,界面中就能識別出拍攝物體的種類,其中就有AI的一份功勞。然而這種能力并未讓用戶感到不可或缺,或是能為工作與生活帶來質的改變。

但今年以來Stable Diffusion在智能手機上的功能演示,卻無疑帶來了更多遐想。

體驗迎來新契機

作者頭一陣恰好體驗了運行在Android手機上的Stable Diffusion終端側演示,僅僅通過一臺與目前市面上主流旗艦手機配置相當,搭載第二代驍龍8機型的手機,通過輸入一段文本描述后,等待約10多秒鐘左右,就能眼見其從模糊到清晰的創(chuàng)作出一張圖畫。

整個過程完全在終端側運行,無需借助云端的AI算力。要知道,如今以ChatGPT為代表的云端計算壓力可謂不小,登陸暫緩都是常有的事,為此不少高粘性用戶則開始選擇購買更高階的會員。但對于普通用戶來說,其對功能的要求,可能不至于非要每月花上20美元。

在Stable Diffusion終端側演示中,高通從Hugging Face的FP32 1-5版本開源模型入手,通過量化、編譯和硬件加速進行優(yōu)化,使其能在搭載第二代驍龍8移動平臺的手機上運行。通過全棧優(yōu)化最終讓Stable Diffusion能夠在智能手機上運行,在15秒內執(zhí)行20步推理,生成一張512x512像素的圖像。這是在智能手機上最快的推理速度,能媲美云端時延,且用戶文本輸入完全不受限制。

蘋果公司在去年年底同樣在 macOS 13.1 和 iOS 16.2 中發(fā)布了針對 Stable Diffusion 的 Core ML 優(yōu)化,并通過一個代碼庫對部署過程進行了詳細講解。在三款蘋果設備(M1 iPad Pro 8GB、M1 MacBook Pro 16GB、M2 MacBook Air 8GB)上的測試結果表明,蘋果推出的相關優(yōu)化基本可以保證最新版 Stable Diffusion(SD 2.0)在半分鐘內生成一張同樣分辨率為512x512像素的圖。這無疑也為未來蘋果將Stable Diffusion功能在自家設備中實現(xiàn)本地化運行奠定了基礎。

正在凸顯的手機AI能力

實際上,目前移動端的AI能力已經在一些工作上凸顯出來。例如在iPad上擁有很多摳取視頻中圖像的App,以往這項在電腦端需要較大精力的工作,借助搭載M1/M2芯片iPad上的神經網絡引擎,能夠輕松的對目標圖像進行摳取,并實現(xiàn)相關特效效果。進而致使很多人開始使用iPad先行制作一些特效,然后再將素材傳輸至電腦端與其他素材一并進行二次剪輯。

以M1芯片為例,相較于蘋果之前所采用的處理器,機器學習的速度提升了15倍,這源于蘋果專門為其加入了神經網絡引擎,采用16核架構,每秒能進行 11 萬億次運算。在運行視頻分析、語音識別以及圖像處理等任務時的處理速度都能實現(xiàn)明顯提升。

以驍龍8系處理器為代理的Android陣營,在近年來的AI能力同樣在翻倍提升。上文中能夠流暢運行Stable Diffusion本地演示的第二代驍龍8,其AI 引擎的主要組成部分Hexagon 處理器專門升級了微切片推理和更大的張量加速器,采用專用供電系統(tǒng),并首次在手機端實現(xiàn) INT4 精度格式的支持,因此在 AI 推理時性能最多可以提高4.35倍,能效提升60%。新增的微切片推理功能,恰恰能夠幫助Stable Diffusion等大型模型高效運行。

愛奇藝出品的真人秀節(jié)目《元音大冒險》中則展現(xiàn)出了AI說帶來的全新體驗提升,在節(jié)目攝制中,借助搭載驍龍旗艦手機所支持的高通AI引擎,及其專門面向AI神經網絡的硬件加速單元等技術的支持下,僅僅通過一個頭盔及一部搭載驍龍芯片的智能手機,即可將所有的細節(jié)、場景、表情精準地映射至“元音大陸”中。據悉,驍龍8系移動平臺搭載高通AI引擎,具備行業(yè)領先的終端側AI性能和能效比,可以支持基于300個人臉特征點的檢測,在為節(jié)目制作提供強有力的支持和保障同時,也降低了節(jié)目制作的技術門檻與成本。

在PC設備更新?lián)Q代頻率早就遠遠落后于智能手機的當下,智能手機的本地AI能力將更加凸顯,實時了解到智能用戶在拍什么的AI,實現(xiàn)了比相機更加優(yōu)秀的成像效果。對圖形的理解能力,造就了比電腦更強的視頻創(chuàng)作能力,方便好用的邊緣側AI能力正在到來。

方便好用的邊緣側AI能力

近期,借助AI接口所開發(fā)的小型應用不斷涌現(xiàn),相比于登陸賬號、問問題的方式,將功能聚焦在了如文章翻譯這一熱門使用場景,用戶可以通過App像使用以往的那些翻譯應用一樣,快速進行使用,且在準確率與流暢度上有了大幅提升。

對于云端AI計算而言,其所面向的用戶群更多為企業(yè)或研究機構,針對藥物研發(fā)、基因工程、數(shù)字孿生模擬等行業(yè)領域,都需要超強的算力作為保障,才能在更短的時間內,獲得研究人員想要的結果。而普通用戶使用頻次更高的語音轉文字、翻譯、文章或圖畫創(chuàng)作,通過邊緣側AI能力,能夠獲得更快的響應速度,擺脫了部分云連接的束縛,整體體驗也能獲得更好的提升。

有業(yè)內人士預計,今年年底或明年年初,消費市場將會為了獲得更強的AI能力而購買新的終端產品,AI將引爆新的終端需求。于此同時,今年的芯片產品也將繼續(xù)在AI性能上實現(xiàn)更大幅度的升級,來滿足圍繞AI而產生的相關用例的爆發(fā)。

試想一下,未來用戶通過手機就能自動生成一個有趣的配圖,用于社交媒體內容、文章配圖、工作演示等不同用途。這些功能又需要以移動設備的本地AI能力作為依托,用戶為了加速十多秒的等待,可能會購置更強AI性能的手機,或許目前智能手機的需求瓶頸將通過AI得以解決。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2023-04-13
手機的下一個突破口,AI能否帶來新飛躍
手機的下一個突破口,AI能否帶來新飛躍

長按掃碼 閱讀全文