全球首個(gè)知識(shí)增強(qiáng)千億大模型“鵬城-百度?文心”發(fā)布

原標(biāo)題:全球首個(gè)知識(shí)增強(qiáng)千億大模型“鵬城-百度?文心”發(fā)布

AI大模型是人工智能開(kāi)發(fā)、應(yīng)用的基礎(chǔ)設(shè)施,體現(xiàn)著一個(gè)國(guó)家的AI技術(shù)發(fā)展水平。12月8日,鵬城實(shí)驗(yàn)室與百度舉辦新聞發(fā)布會(huì),聯(lián)合發(fā)布全球首個(gè)知識(shí)增強(qiáng)千億大模型——“鵬城-百度·文心”(模型版本號(hào):ERNIE 3.0 Titan),該模型參數(shù)規(guī)模達(dá)2600億,是目前全球最大的中文單體模型?!谤i城-百度·文心”在機(jī)器閱讀理解、文本分類、語(yǔ)義相似度計(jì)算等60多項(xiàng)任務(wù)中取得最好效果,并在30余項(xiàng)小樣本和零樣本任務(wù)上刷新基準(zhǔn)。

中國(guó)工程院院士、鵬城實(shí)驗(yàn)室主任高文(左),百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室主任王海峰聯(lián)合發(fā)布“鵬城-百度·文心”

中國(guó)工程院院士、鵬城實(shí)驗(yàn)室主任高文在發(fā)布會(huì)上表示,大模型對(duì)于整個(gè)科學(xué)的發(fā)展、社會(huì)的發(fā)展、創(chuàng)新的發(fā)展都是非常重要的工具。運(yùn)用這個(gè)工具,可以讓更多行業(yè)受益于人工智能的賦能,這對(duì)人工智能的發(fā)展是一個(gè)福音。

為解決“鵬城-百度·文心”大模型應(yīng)用落地難題,百度團(tuán)隊(duì)首創(chuàng)大模型在線蒸餾技術(shù),模型參數(shù)壓縮率可達(dá)99.98%。壓縮版模型僅保留0.02%參數(shù)規(guī)模就能與原有模型效果相當(dāng),更有利于產(chǎn)業(yè)大規(guī)模應(yīng)用。本著開(kāi)源開(kāi)放的理念,該模型代碼近期會(huì)在OpenI啟智社區(qū)開(kāi)源,依托“鵬城云腦Ⅱ”對(duì)外開(kāi)放,助力科技創(chuàng)新,推動(dòng)產(chǎn)業(yè)發(fā)展。

“鵬城-百度·文心”大模型的成功研發(fā),源于鵬城實(shí)驗(yàn)室與百度共同成立的“鵬城-百度自然語(yǔ)言處理聯(lián)合實(shí)驗(yàn)室”。 “鵬城-百度·文心”大模型基于鵬城實(shí)驗(yàn)室的算力系統(tǒng)“鵬城云腦Ⅱ”和百度飛槳深度學(xué)習(xí)平臺(tái)的支持,解決了超大模型訓(xùn)練的多個(gè)公認(rèn)技術(shù)難題,實(shí)現(xiàn)了訓(xùn)練速度大幅提升、效果更優(yōu)?!谤i城云腦Ⅱ”是自主研發(fā)的國(guó)內(nèi)首個(gè)E級(jí)AI算力平臺(tái),曾在多個(gè)國(guó)際性能測(cè)試比賽中奪冠;飛槳是我國(guó)首個(gè)自主研發(fā)的深度學(xué)習(xí)開(kāi)源開(kāi)放平臺(tái),創(chuàng)建了端到端自適應(yīng)分布式訓(xùn)練框架,實(shí)現(xiàn)多硬件支持,并行效率高達(dá)90%。

百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室主任王海峰發(fā)布百度產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型“文心”全景圖

當(dāng)日發(fā)布會(huì)上,百度產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型“文心”全景圖也首次亮相。王海峰介紹,最新的產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型“文心”全景圖,既包含基礎(chǔ)通用的大模型,也包含面向重點(diǎn)領(lǐng)域、重點(diǎn)任務(wù)的大模型,以及豐富的工具與平臺(tái),有助于推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。

目前,百度“文心”通過(guò)百度飛槳平臺(tái)陸續(xù)對(duì)外開(kāi)源開(kāi)放,并大規(guī)模應(yīng)用于百度搜索、信息流、智能音箱等產(chǎn)品,并通過(guò)百度智能云賦能工業(yè)、能源、金融、通信、媒體、教育等眾多行業(yè)。在金融領(lǐng)域,通過(guò)百度“文心”大模型賦能,同時(shí)結(jié)合百度全流程AI開(kāi)發(fā)平臺(tái)BML提供模型再訓(xùn)練的能力,基于定制的保險(xiǎn)合同條款“智能解析模型”,不僅能夠完成一份合同內(nèi)近40個(gè)類目條款的智能分類,根據(jù)計(jì)算,業(yè)務(wù)員處理單份合同文本的時(shí)長(zhǎng)縮短到1分鐘,速度提升了幾十倍。百度智能云的“智能客服”也基于百度“文心”提升了服務(wù)的精準(zhǔn)性,目前已在中國(guó)聯(lián)通、浦發(fā)銀行等國(guó)內(nèi)眾多企業(yè)中得到應(yīng)用。(完)

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2021-12-09
全球首個(gè)知識(shí)增強(qiáng)千億大模型“鵬城-百度?文心”發(fā)布
“鵬城-百度·文心”大模型基于鵬城實(shí)驗(yàn)室的算力系統(tǒng)“鵬城云腦Ⅱ”和百度飛槳深度學(xué)習(xí)平臺(tái)的支持,解決了超大模型訓(xùn)練的多個(gè)公認(rèn)技術(shù)難題,實(shí)現(xiàn)了訓(xùn)練速度大幅提升、效果更優(yōu)。

長(zhǎng)按掃碼 閱讀全文