不少人都有過這樣的“心動”體驗:上班路上打開網(wǎng)易新聞,推薦內(nèi)容恰好是自己最近關(guān)注的行業(yè)動態(tài);下班途中打開網(wǎng)易云音樂,驚喜的發(fā)現(xiàn)了幾個小眾寶藏歌手,忍不住直呼“網(wǎng)易云真是太懂我了!”
個性化的推薦機制像一個貼心的朋友,在互聯(lián)網(wǎng)的海量信息中,總能捕捉到最合你心意的那個。
個性化推薦機制的背后:多模態(tài)大模型保駕護航
作為國內(nèi)專業(yè)從事游戲與泛娛樂AI研究和應(yīng)用的頂尖機構(gòu),網(wǎng)易伏羲于2021年起著力打造“玉知”多模態(tài)理解大模型?;趫D片-文本雙塔結(jié)構(gòu),先后訓(xùn)練了2億、4億、9億參數(shù)的“玉知”版本。同時,利用網(wǎng)易伏羲開源的EET高效推理框架,對模型壓縮、算法適配、硬件底層等方面進行優(yōu)化,使其推理速度提升4倍,滿足了線上的高并發(fā)需求,降低了部署資源的損耗。
在業(yè)務(wù)數(shù)據(jù)集的zero-shot評測中,“玉知”多模態(tài)理解大模型優(yōu)于Chinese-CLIP的CN-CLIPViT-H/14。
“玉知”多模態(tài)理解大模型目前已在網(wǎng)易的多個業(yè)務(wù)場景中落地驗證,為個性化推薦機制保駕護航:網(wǎng)易新聞基于“玉知”構(gòu)建的圖文內(nèi)容表征,在推薦環(huán)節(jié)采用基于該圖文向量的dropoutnet召回優(yōu)化,對召回源、列表頁視頻試投、列表頁試投整體等效果明顯改進,實現(xiàn)視頻和整體大盤的業(yè)務(wù)指標(biāo)提升;網(wǎng)易云音樂基于“玉知”構(gòu)建的內(nèi)容表征引擎和內(nèi)容相似檢索引擎,在云音樂視頻、長音頻、廣告等多個業(yè)務(wù)中,實現(xiàn)了對內(nèi)容冷啟動效率、CTR預(yù)估模型的優(yōu)化,帶來顯著收益。
網(wǎng)易+昇騰AI:創(chuàng)造1+1>2的智能體驗
為了更好的使能大模型應(yīng)用創(chuàng)新,昇騰AI構(gòu)建了從規(guī)劃、開發(fā)到產(chǎn)業(yè)化的大模型全流程使能體系,并于2022年正式發(fā)布了昇騰AI大模型開發(fā)使能平臺,打通了大模型從開發(fā)到部署的全流程。
在大模型的開發(fā)上,通過昇思MindSpore提供的自動混合并行API來加速訓(xùn)練過程,利用高階的Transformer API,百行代碼實現(xiàn)千億級參數(shù)的模型開發(fā),同時獲得更好的模型性能;為加速大模型場景化適配,打造了豐富的微調(diào)套件,已成功應(yīng)用于紫東太初大模型開放服務(wù)平臺建設(shè),支持小樣本訓(xùn)練和模型一鍵微調(diào);在大模型的推理部署上,昇騰AI提供的模型壓縮工具,在精度基本無損的情況下,降低了70%計算量,提升了20%以上的推理性能。
為了給用戶帶來更好的智能體驗,網(wǎng)易伏羲聯(lián)合昇思MindSpore及華為諾亞團隊,充分分析互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)集特性,對多模態(tài)模型結(jié)構(gòu)進行優(yōu)化,優(yōu)選合適編碼器并采用多階段訓(xùn)練模式,基于昇騰AI大模型開發(fā)使能平臺,共同打造了玉知-悟空圖文理解大模型。
玉知-悟空圖文理解大模型可廣泛應(yīng)用在互聯(lián)網(wǎng)推薦搜索等業(yè)務(wù)中,通過提取圖文的特征進行相關(guān)的檢索。在網(wǎng)易視頻推薦業(yè)務(wù)的應(yīng)用中,玉知-悟空圖文理解大模型在核心算法指標(biāo)中得到近5%的提升,效果遠超預(yù)期。未來,聯(lián)合團隊將進一步將成果應(yīng)用到網(wǎng)易新聞、網(wǎng)易云音樂等更豐富的業(yè)務(wù)場景中,提升最終用戶的個性化體驗。
當(dāng)被輸入豐富的行業(yè)知識時,更精更專的大模型將顯現(xiàn)出巨大的應(yīng)用價值。昇騰AI大模型開發(fā)使能平臺,已經(jīng)具備了支持大模型開發(fā)所需的各項核心技術(shù),同時提供了一整套高效、易用的大模型使能套件,形成了端到端的使能大模型開發(fā)能力。未來,昇騰AI將聯(lián)合網(wǎng)易以及更多行業(yè)伙伴共建共享,助力大模型創(chuàng)新,為繁榮AI產(chǎn)業(yè)生態(tài)鋪就一條信心之路。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )