自研大模型、打造“智能體”,vivo打開敘事新空間

(高靖宇/文)近年來手機(jī)產(chǎn)業(yè)發(fā)展進(jìn)入創(chuàng)新期,手機(jī)廠商正試圖尋找新的差異化出路。特別今年以來,隨著ChatGPT的橫空出世和全民級(jí)應(yīng)用發(fā)展趨勢(shì),眾多手機(jī)廠商紛紛入局AI大模型賽道,成為當(dāng)下最火熱的技術(shù)賽道。

而在這場大模型競賽中,vivo顯然走在了前列。11月1日,在2023 vivo開發(fā)者大會(huì)上,vivo正式發(fā)布自研藍(lán)心大模型BlueLM、OriginOS 4、自研藍(lán)河操作系統(tǒng)BlueOS。其中,藍(lán)心大模型是vivo自研通用大模型矩陣,從開源到完全自研歷時(shí)6年,包括十億、百億、千億三個(gè)不同參數(shù)量級(jí)的5款自研大模型,全面覆蓋核心應(yīng)用場景,并將大模型矩陣能力全面融入到OriginOS 4。這意味著,vivo端側(cè)大模型已從前沿技術(shù)探索進(jìn)入到應(yīng)用和產(chǎn)業(yè)級(jí)落地新階段。

大模型與手機(jī)結(jié)合之后,智能手機(jī)又有了新敘事,為未來智能手機(jī)發(fā)展探索出新方向。vivo副總裁、OS產(chǎn)品副總裁周圍預(yù)判,未來手機(jī)的發(fā)展趨勢(shì)或?qū)⑦M(jìn)化為“智能體”。

如何將大模型裝入手機(jī)?答案是:端云協(xié)同

通過類似ChatGPT、文心一言的APP就能使用大模型,為什么還要把大模型裝入到手機(jī)端側(cè)呢?這是因?yàn)椋c單純?cè)谠贫瞬渴鹕墒?AI 應(yīng)用和服務(wù)相比,手機(jī)終端側(cè)部署生成式 AI 可以實(shí)現(xiàn)在設(shè)備端運(yùn)行復(fù)雜的AI算法,從而減少對(duì)云端服務(wù)的依賴,個(gè)人私密信息也不用上傳的云端,保障數(shù)據(jù)安全。此外,手機(jī)可以更好地理解和響應(yīng)用戶的需求,從而滿足用戶對(duì)更加智能化手機(jī)的期待。

那么,大模型千億級(jí)的參數(shù)量如何在手機(jī)上流程運(yùn)行,此時(shí)端云協(xié)同的混合架構(gòu)就成為關(guān)鍵。vivo的藍(lán)心大模型包含有10億、70億、700億、1300億、1750億五種參數(shù)規(guī)模,其中10億量級(jí)模型是主要面向端側(cè)場景打造的專業(yè)文本大模型,具備本地化的文本總結(jié)、摘要等能力。70億模型是面向手機(jī)打造的端云兩用模型,具有優(yōu)秀的語言理解、文本創(chuàng)作能力,同時(shí),上述兩個(gè)量級(jí)的模型支持高通和MTK最新旗艦雙平臺(tái)端側(cè)化部署,在保證數(shù)據(jù)安全的同時(shí),在出詞速度、響應(yīng)時(shí)間、內(nèi)存占用等方面也非常優(yōu)秀,實(shí)現(xiàn)了安全與性能的雙重并舉。

vivo同時(shí)在做的有10億、70億、700億、1300億、1750億五種參數(shù)規(guī)模的藍(lán)心大模型,其中10億和70億已經(jīng)可以由本地算力支撐,而更大的數(shù)據(jù)仍然需要運(yùn)行在云端。為此,vivo并不會(huì)強(qiáng)制用戶必須使用端側(cè)或者云端,而是交給用戶自己去選擇,比如隱私保密性不需要那么高的輸入法等功能,可以選擇在云端運(yùn)行,而公司文件、相冊(cè)等,就可以利用手機(jī)本身的算力來完成。

700億模型是面向云端服務(wù)的主力模型,其綜合能力,在C-Eval、CMMLU、SuperCLUE(10月)等榜單中均處于中文大模型的第一梯隊(duì)。另外1300億、1750億模型也將在更復(fù)雜的場景中以更豐富的知識(shí)和推理能力為用戶帶來更專業(yè)的智能體驗(yàn)。

除了與云端協(xié)作,手機(jī)大模型還面臨算法和算力的挑戰(zhàn)。vivo整個(gè)團(tuán)隊(duì)花了六年多時(shí)間不斷解決問題,在算法方面,在預(yù)訓(xùn)練階段,vivo利用最前沿的Transformer架構(gòu),改良了注意力機(jī)制、位置編碼等關(guān)鍵模塊,并在包含了3.3萬億詞的大規(guī)模多語言數(shù)據(jù)集上進(jìn)行訓(xùn)練,最終使得藍(lán)心大模型具備了超強(qiáng)的基礎(chǔ)能力。算力上,vivo也在積極通過信息技術(shù)應(yīng)用創(chuàng)新去解決算力問題,組建了一只150人的工程團(tuán)隊(duì),持續(xù)地提升集群的效率,目前vivo千億模型訓(xùn)練周期低于2個(gè)月,百億模型不到2周。

目前,vivo構(gòu)建了超過100萬條高質(zhì)量的多語言多任務(wù)指令數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練,從而讓藍(lán)心大模型更好地理解用戶的意圖,適應(yīng)各種目標(biāo)任務(wù)。并在安全部署中通過了中國信通院內(nèi)容審核服務(wù)系統(tǒng)評(píng)測,在文本、語音和視頻內(nèi)容識(shí)別需要檢測的15個(gè)大類中,14個(gè)大類獲得最高的5星等級(jí),1個(gè)獲得4星等級(jí)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-11-03
自研大模型、打造“智能體”,vivo打開敘事新空間
近年來手機(jī)產(chǎn)業(yè)發(fā)展進(jìn)入創(chuàng)新期,手機(jī)廠商正試圖尋找新的差異化出路。特別今年以來,隨著ChatGPT的橫空出世和全民級(jí)應(yīng)用發(fā)展趨勢(shì),眾多手機(jī)廠商紛紛入局AI大模型賽

長按掃碼 閱讀全文