快手自研大模型「快意」亮相 在多個(gè)大模型榜單上表現(xiàn)優(yōu)異

據(jù)報(bào)道,快手正式加入大模型賽道,其自研大模型「快意」(KwaiYii)已經(jīng)開(kāi)啟內(nèi)測(cè),并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn)API和定制化項(xiàng)目合作方案。目前,「快意」在多個(gè)知名大模型排行榜上表現(xiàn)強(qiáng)勁,在CMMLU中文向排名第一,引發(fā)了廣泛關(guān)注。

KwaiYii-13B在CMMLU中文向排名第一

根據(jù)其GitHub主頁(yè)介紹,「快意」是由快手AI團(tuán)隊(duì)從零到一獨(dú)立自研的大規(guī)模語(yǔ)言模型,而本次引發(fā)關(guān)注的正是其新版本KwaiYii-13B。該模型在多個(gè)Benchmark上都處于領(lǐng)先水平,證明了其在自然語(yǔ)言處理任務(wù)中的出色性能。

其中,KwaiYi-13B-Base預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領(lǐng)先水平,顯示了快意大模型在中文和英文上都具備非常強(qiáng)悍的能力。

KwaiYii-13B-Base在Benchmark上的效果(來(lái)源:快意GitHub主頁(yè))

而KwaiYii-13B-Chat對(duì)話模型具備出色的語(yǔ)言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對(duì)話等廣泛任務(wù),人工評(píng)估結(jié)果表明KwaiYi-13B-Chat超過(guò)主流的開(kāi)源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近ChatGPT(3.5)同等水平。

KwaiYii-13B-Chat在人工評(píng)測(cè)上的效果(來(lái)源:快意GitHub主頁(yè))

據(jù)悉,目前「快意」已經(jīng)開(kāi)啟內(nèi)測(cè),并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn)API和定制化項(xiàng)目合作方案,以便在各種業(yè)務(wù)場(chǎng)景中進(jìn)行測(cè)試和驗(yàn)證。

正在內(nèi)測(cè)的「快意」對(duì)話平臺(tái)

一直以來(lái),快手AI團(tuán)隊(duì)都在專業(yè)領(lǐng)域有著出色的表現(xiàn),研究成果頻繁出現(xiàn)在國(guó)際頂級(jí)會(huì)議和期刊上,也多次在全球性比賽中獲獎(jiǎng)。2022年至今,快手AI團(tuán)隊(duì)已發(fā)表130多篇頂會(huì)論文,覆蓋機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別、搜推廣等多項(xiàng)研究領(lǐng)域,包含 ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9) 等頂級(jí)會(huì)議。

此前,已有消息表明快手在大模型落地方面進(jìn)展迅速。7 月 8 日,快手宣布正在內(nèi)測(cè)智能問(wèn)答產(chǎn)品,在搜索場(chǎng)景中為用戶帶來(lái)智能問(wèn)答和文本創(chuàng)作等新功能。8 月 8 日,「快手 AI 對(duì)話」開(kāi)啟測(cè)試,以搜索場(chǎng)景為入口,為用戶提供更多元、便捷的搜索形態(tài),大為降低用戶的搜索使用門檻,讓新技術(shù)帶來(lái)的便利惠及更廣泛的人群。據(jù)悉,這兩個(gè)新產(chǎn)品功能均基于「快意」大模型研發(fā)。

8 月 18 日,「快手 AI 對(duì)話」 功能已經(jīng)在快手 APP 安卓版本開(kāi)放內(nèi)測(cè),這也是短視頻直播行業(yè)首個(gè)基于大語(yǔ)言模型落地的智能問(wèn)答產(chǎn)品,在搜索場(chǎng)景中為用戶帶來(lái)智能問(wèn)答和文本創(chuàng)作等新功能。參與測(cè)試的用戶點(diǎn)擊快手搜索首頁(yè)右上角AI圖標(biāo)即可進(jìn)入產(chǎn)品首頁(yè),選擇輸入內(nèi)容對(duì)話或點(diǎn)擊引導(dǎo)問(wèn)題便可開(kāi)啟對(duì)話,或者觸發(fā)「搜索智能問(wèn)答」卡片,通過(guò)底部入口可以啟用該功能。

快手App已內(nèi)測(cè)AI對(duì)話功能

據(jù)稱,快手AI團(tuán)隊(duì)將持續(xù)迭代「快意」大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力 ,另一方面也在推進(jìn)更多C端與B端業(yè)務(wù)場(chǎng)景下的落地 ??梢灶A(yù)見(jiàn),隨著如「快意」等大模型的不斷發(fā)展,AI的應(yīng)用邊界將得到進(jìn)一步的拓寬,將能為用戶帶來(lái)更豐富的產(chǎn)品體驗(yàn)和更高效的服務(wù)。

據(jù)報(bào)道,快手正式加入大模型賽道,其自研大模型「快意」(KwaiYii)已經(jīng)開(kāi)啟內(nèi)測(cè),并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn)API和定制化項(xiàng)目合作方案。目前,「快意」在多個(gè)知名大模型排行榜上表現(xiàn)強(qiáng)勁,在CMMLU中文向排名第一,引發(fā)了廣泛關(guān)注。

KwaiYii-13B在CMMLU中文向排名第一

根據(jù)其GitHub主頁(yè)介紹,「快意」是由快手AI團(tuán)隊(duì)從零到一獨(dú)立自研的大規(guī)模語(yǔ)言模型,而本次引發(fā)關(guān)注的正是其新版本KwaiYii-13B。該模型在多個(gè)Benchmark上都處于領(lǐng)先水平,證明了其在自然語(yǔ)言處理任務(wù)中的出色性能。

其中,KwaiYi-13B-Base預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領(lǐng)先水平,顯示了快意大模型在中文和英文上都具備非常強(qiáng)悍的能力。

KwaiYii-13B-Base在Benchmark上的效果(來(lái)源:快意GitHub主頁(yè))

而KwaiYii-13B-Chat對(duì)話模型具備出色的語(yǔ)言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對(duì)話等廣泛任務(wù),人工評(píng)估結(jié)果表明KwaiYi-13B-Chat超過(guò)主流的開(kāi)源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近ChatGPT(3.5)同等水平。

KwaiYii-13B-Chat在人工評(píng)測(cè)上的效果(來(lái)源:快意GitHub主頁(yè))

據(jù)悉,目前「快意」已經(jīng)開(kāi)啟內(nèi)測(cè),并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn)API和定制化項(xiàng)目合作方案,以便在各種業(yè)務(wù)場(chǎng)景中進(jìn)行測(cè)試和驗(yàn)證。

正在內(nèi)測(cè)的「快意」對(duì)話平臺(tái)

一直以來(lái),快手AI團(tuán)隊(duì)都在專業(yè)領(lǐng)域有著出色的表現(xiàn),研究成果頻繁出現(xiàn)在國(guó)際頂級(jí)會(huì)議和期刊上,也多次在全球性比賽中獲獎(jiǎng)。2022年至今,快手AI團(tuán)隊(duì)已發(fā)表130多篇頂會(huì)論文,覆蓋機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別、搜推廣等多項(xiàng)研究領(lǐng)域,包含 ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9) 等頂級(jí)會(huì)議。

此前,已有消息表明快手在大模型落地方面進(jìn)展迅速。7 月 8 日,快手宣布正在內(nèi)測(cè)智能問(wèn)答產(chǎn)品,在搜索場(chǎng)景中為用戶帶來(lái)智能問(wèn)答和文本創(chuàng)作等新功能。8 月 8 日,「快手 AI 對(duì)話」開(kāi)啟測(cè)試,以搜索場(chǎng)景為入口,為用戶提供更多元、便捷的搜索形態(tài),大為降低用戶的搜索使用門檻,讓新技術(shù)帶來(lái)的便利惠及更廣泛的人群。據(jù)悉,這兩個(gè)新產(chǎn)品功能均基于「快意」大模型研發(fā)。

8 月 18 日,「快手 AI 對(duì)話」 功能已經(jīng)在快手 APP 安卓版本開(kāi)放內(nèi)測(cè),這也是短視頻直播行業(yè)首個(gè)基于大語(yǔ)言模型落地的智能問(wèn)答產(chǎn)品,在搜索場(chǎng)景中為用戶帶來(lái)智能問(wèn)答和文本創(chuàng)作等新功能。參與測(cè)試的用戶點(diǎn)擊快手搜索首頁(yè)右上角AI圖標(biāo)即可進(jìn)入產(chǎn)品首頁(yè),選擇輸入內(nèi)容對(duì)話或點(diǎn)擊引導(dǎo)問(wèn)題便可開(kāi)啟對(duì)話,或者觸發(fā)「搜索智能問(wèn)答」卡片,通過(guò)底部入口可以啟用該功能。

快手App已內(nèi)測(cè)AI對(duì)話功能

據(jù)稱,快手AI團(tuán)隊(duì)將持續(xù)迭代「快意」大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力 ,另一方面也在推進(jìn)更多C端與B端業(yè)務(wù)場(chǎng)景下的落地 ??梢灶A(yù)見(jiàn),隨著如「快意」等大模型的不斷發(fā)展,AI的應(yīng)用邊界將得到進(jìn)一步的拓寬,將能為用戶帶來(lái)更豐富的產(chǎn)品體驗(yàn)和更高效的服務(wù)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )