9月25日消息,百川智能發(fā)布Baichuan2-53B 閉源大模型,全面升級(jí)了Baichuan1-53B的各項(xiàng)能力。Baichuan2-53B不僅數(shù)學(xué)和邏輯推理能力提升顯著,還通過高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)極大降低了模型幻覺。
作為首批通過備案的大模型企業(yè),百川智能此次還開放了Baichuan2-53B API接口,正式進(jìn)軍To B領(lǐng)域,開啟商業(yè)化進(jìn)程。此次開放API后,百川智能將把行業(yè)領(lǐng)先的大模型能力賦能給各行各業(yè)的合作伙伴,助力萬千企業(yè)智能化發(fā)展。
Baichuan2-53B 是百川智能發(fā)布的第6款大模型,自4月10日成立以來,該公司以平均每28天推出一個(gè)大模型的速度持續(xù)創(chuàng)新。不久之前發(fā)布的Baichuan 2開源大模型在多項(xiàng)評(píng)估任務(wù)中大幅領(lǐng)先 LLaMA2。
數(shù)學(xué)和邏輯推理能力大幅提升
百川智能于2023年8月8日發(fā)布Baichuan-53B搜索增強(qiáng)大模型,模型在知識(shí)問答、文學(xué)創(chuàng)作等方面表現(xiàn)優(yōu)異,展現(xiàn)出商業(yè)文案創(chuàng)作(郵件撰寫、公司命名、營(yíng)銷文案生成)、文學(xué)創(chuàng)作(故事續(xù)寫、詩詞創(chuàng)作)、中文理解(語義識(shí)別、成語含義、詩詞分析)等多種任務(wù)場(chǎng)景下的強(qiáng)大能力。
大模型的數(shù)學(xué)和邏輯推理能力一直是業(yè)內(nèi)的關(guān)注焦點(diǎn),也是評(píng)價(jià)一款大模型是否領(lǐng)先的重要指標(biāo)。在Baichuan-53B的基礎(chǔ)上,Baichuan2-53B不僅重點(diǎn)強(qiáng)化了以上兩個(gè)維度的能力,并且對(duì)整體能力進(jìn)行了全面升級(jí)。其中,邏輯推理能力提升100%,數(shù)學(xué)能力提升31%,語言理解能力提升29%,文本創(chuàng)作提升18%,知識(shí)問答提升9%。
客觀問答準(zhǔn)確率行業(yè)領(lǐng)先
幻覺是大模型落地應(yīng)用必須跨越的鴻溝。通常而言,解決這一問題有兩種方式,一種是不斷增加模型的數(shù)據(jù)規(guī)模、提升數(shù)據(jù)質(zhì)量;另一種是通過調(diào)用搜索等外部工具讓模型能夠獲取實(shí)時(shí)信息。
據(jù)悉,Baichuan2-53B在兩個(gè)方面均做了大量?jī)?yōu)化。高質(zhì)量數(shù)據(jù)構(gòu)建方面,Baichuan2-53B獨(dú)創(chuàng)了一套數(shù)據(jù)質(zhì)量體系。以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類,確保Baichuan-53B始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。
信息獲取方面,Baichuan2-53B對(duì)多個(gè)模塊進(jìn)行了升級(jí),包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。這一綜合體系通過深入理解用戶指令,精確驅(qū)動(dòng)查詢?cè)~的搜索,最終結(jié)合大語言模型技術(shù),優(yōu)化模型結(jié)果生成的可靠性,實(shí)現(xiàn)更精確、更智能的模型回答結(jié)果,減少模型幻覺。
在高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)技術(shù)的加持下,Baichuan2-53B有效降低了模型幻覺。百川智能使用 FacTool 評(píng)測(cè)后的結(jié)果顯示,Baichuan2-53B 的綜合得分為140.5,在主流基礎(chǔ)大模型中僅排在GPT-4之后,處于國(guó)內(nèi)領(lǐng)先水平。
FacTool是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、Meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架(項(xiàng)目地址:https://github.com/GAIR-NLP/factool),能夠查核大模型生成內(nèi)容的事實(shí)準(zhǔn)確性(也能查核一般性內(nèi)容的事實(shí)準(zhǔn)確性)。
開放API, 全面進(jìn)軍To B領(lǐng)域
除了能力全面升級(jí),Baichuan2-53B 還開放了API接口,企業(yè)和開發(fā)者可以通過API將Baichuan2-53B集成至他們的應(yīng)用程序和服務(wù)中。Baichuan2-53B融合了最前沿的大模型技術(shù),可以很好的適配不同企業(yè)的各種業(yè)務(wù)需求,無論是智能客服、智能寫作還是智能推薦都能打造行業(yè)領(lǐng)先的用戶體驗(yàn)。
據(jù)介紹,Baichuan2-53B的API接口便捷易用,客戶只需要簡(jiǎn)單的配置和集成即可接入,同時(shí)其對(duì)OpenAI的接口高度兼容,客戶可以快速遷移,極大降低了模型的部署和轉(zhuǎn)換成本。
同時(shí),百川智能強(qiáng)調(diào),對(duì)于企業(yè)用戶最關(guān)注的安全合規(guī)問題,作為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè),百川智能為Baichuan2-53B打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng),能夠?yàn)榭蛻艉秃献骰锇樘峁┤鞒痰陌踩U稀?/p>
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型Baichuan4-Finance,整體準(zhǔn)確率領(lǐng)先GPT-4o近20%
- 央視曝光未成年人可輕松繞開“防沉迷”系統(tǒng):租號(hào)玩游戲最低僅需4元
- 知乎發(fā)布2024“年度十問”:《黑神話:悟空》、諾貝爾物理學(xué)獎(jiǎng)等問題在列
- 李斌回應(yīng)螢火蟲三重奏大燈設(shè)計(jì):沒有參考iPhone
- 一周熱點(diǎn)匯總:特斯拉下月量產(chǎn)改款Model Y,阿里“甩賣”銀泰
- 蔚來第三品牌firefly螢火蟲首款車型正式亮相 預(yù)售價(jià)14.88萬元
- 首發(fā)線控轉(zhuǎn)向等多項(xiàng)技術(shù) 蔚來旗艦車型ET9正式上市:78.8萬元起
- 網(wǎng)信辦:從嚴(yán)打擊網(wǎng)上侵害未成年人合法權(quán)益行為
- 豆包大模型全面升級(jí),相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示
- “小紅書封號(hào)”沖上熱搜,小米YU7無偽裝實(shí)車首次曝光
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。