全球首個知識增強千億大模型“鵬城-百度?文心”發(fā)布

AI大模型是人工智能開發(fā)、應用的基礎設施,體現著一個國家的AI技術發(fā)展水平。12月8日,鵬城實驗室與百度舉辦新聞發(fā)布會,聯合發(fā)布全球首個知識增強千億大模型——“鵬城-百度·文心”(模型版本號:ERNIE 3.0 Titan),該模型參數規(guī)模達2600億,是目前全球最大的中文單體模型。“鵬城-百度·文心”在機器閱讀理解、文本分類、語義相似度計算等60多項任務中取得最好效果,并在30余項小樣本和零樣本任務上刷新基準。

中國工程院院士、鵬城實驗室主任高文(左),百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰聯合發(fā)布“鵬城-百度·文心”

中國工程院院士、鵬城實驗室主任高文在發(fā)布會上表示,大模型對于整個科學的發(fā)展、社會的發(fā)展、創(chuàng)新的發(fā)展都是非常重要的工具。運用這個工具,可以讓更多行業(yè)受益于人工智能的賦能,這對人工智能的發(fā)展是一個福音。

為解決“鵬城-百度·文心”大模型應用落地難題,百度團隊首創(chuàng)大模型在線蒸餾技術,模型參數壓縮率可達99.98%。壓縮版模型僅保留0.02%參數規(guī)模就能與原有模型效果相當,更有利于產業(yè)大規(guī)模應用。本著開源開放的理念,該模型代碼近期會在OpenI啟智社區(qū)開源,依托“鵬城云腦Ⅱ”對外開放,助力科技創(chuàng)新,推動產業(yè)發(fā)展。

“鵬城-百度·文心”大模型的成功研發(fā),源于鵬城實驗室與百度共同成立的“鵬城-百度自然語言處理聯合實驗室”。 “鵬城-百度·文心”大模型基于鵬城實驗室的算力系統(tǒng)“鵬城云腦Ⅱ”和百度飛槳深度學習平臺的支持,解決了超大模型訓練的多個公認技術難題,實現了訓練速度大幅提升、效果更優(yōu)?!谤i城云腦Ⅱ”是自主研發(fā)的國內首個E級AI算力平臺,曾在多個國際性能測試比賽中奪冠;飛槳是我國首個自主研發(fā)的深度學習開源開放平臺,創(chuàng)建了端到端自適應分布式訓練框架,實現多硬件支持,并行效率高達90%。

百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰發(fā)布百度產業(yè)級知識增強大模型“文心”全景圖

當日發(fā)布會上,百度產業(yè)級知識增強大模型“文心”全景圖也首次亮相。王海峰介紹,最新的產業(yè)級知識增強大模型“文心”全景圖,既包含基礎通用的大模型,也包含面向重點領域、重點任務的大模型,以及豐富的工具與平臺,有助于推動技術創(chuàng)新和產業(yè)發(fā)展。

目前,百度“文心”通過百度飛槳平臺陸續(xù)對外開源開放,并大規(guī)模應用于百度搜索、信息流、智能音箱等產品,并通過百度智能云賦能工業(yè)、能源、金融、通信、媒體、教育等眾多行業(yè)。在金融領域,通過百度“文心”大模型賦能,同時結合百度全流程AI開發(fā)平臺BML提供模型再訓練的能力,基于定制的保險合同條款“智能解析模型”,不僅能夠完成一份合同內近40個類目條款的智能分類,根據計算,業(yè)務員處理單份合同文本的時長縮短到1分鐘,速度提升了幾十倍。百度智能云的“智能客服”也基于百度“文心”提升了服務的精準性,目前已在中國聯通、浦發(fā)銀行等國內眾多企業(yè)中得到應用。(完)

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2021-12-09
全球首個知識增強千億大模型“鵬城-百度?文心”發(fā)布
“鵬城-百度·文心”大模型基于鵬城實驗室的算力系統(tǒng)“鵬城云腦Ⅱ”和百度飛槳深度學習平臺的支持,解決了超大模型訓練的多個公認技術難題,實現了訓練速度大幅提升、效果更優(yōu)。

長按掃碼 閱讀全文