12月23日消息,百川智能發(fā)布全鏈路領域增強大模型Baichuan4-Finance。在高質量金融數據的基礎上,通過行業(yè)首創(chuàng)的領域自約束訓練方案,Baichuan4-Finance實現了金融能力和通用能力同步提升的效果,極大提高了金融場景的整體可用性。
Baichuan4-Finance金融專業(yè)能力和場景應用能力領先GPT-4o近20%,在中國人民大學財政金融學院新近發(fā)布的評測體系FLAME以及國內主流開源金融評測基準FinancelQ上均登上榜首。
據介紹,Baichuan4-Finance能夠在效率提升、風控合規(guī)、客服、決策支持等諸多層面為金融行業(yè)帶來全方位的價值提升。Baichuan4-Finance能夠幫助金融從業(yè)者處理文檔審核、客戶咨詢、產品營銷等大量日常工作,還能依托深厚的金融專業(yè)知識和法律法規(guī)理解能力,為機構提供精準的風險識別和合規(guī)保障。此外,還可以憑借強大的數據分析能力為管理層提供專業(yè)的市場洞察和決策建議。
目前,Baichuan4-Finance API已在百川智能官網正式上線。
整體準確率領先GPT-4o近20%,多個金融評測榜單第一
FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)是中國人民大學財政金融學院12月17日發(fā)布的金融評測體系(github地址:https://github.com/FLAME-ruc/FLAME/tree/main)。
作為金融領域最新的評測體系,FLAME兼顧專業(yè)性和實用性,由兩個方向的評測基準組成。其中,FLAME-Cer主要面向模型的專業(yè)金融能力評測,覆蓋了CPA、CFA、FRM等14類權威金融資格認證;FLAME-Sce則側重模型的場景應用能力,包含10個一級核心金融業(yè)務場景,21個二級細分金融業(yè)務場景,近百個三級金融應用任務。
FLAME-Cer評測結果顯示,Baichuan4-Finance在銀行、保險、基金、證券等多個資格認證領域的準確率均突破了95%,整體準確率93.62%,大幅領先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。GPT-4o是金融領域公認的綜合實力最強的通用模型之一,而XuanYuan3-70B-Chat則是國內首個開源中文金融大模型。
在FLAME-Sce評測中,Baichuan4-Finance一級核心金融業(yè)務場景的整體可用率達84.15%,其金融數據計算、金融知識理論等場景的可用率更是超過90%,實際應用場景中的表現非常優(yōu)秀。
不僅如此,在國內主流開源金融評測基準FinanceIQ上Baichuan4-Finance同樣超越了GPT-4o和XuanYuan3-70B,整體準確率達到79.23%,領先GPT-4o近13%。
首創(chuàng)領域自約束訓練方案,模型金融專項能力和通用能力同步提升
如何讓模型在提升專業(yè)能力的同時不損失通用能力,是當下大模型落地具體場景最大的阻礙。為解決這一問題,百川智能打造了一套全鏈路領域增強方案,該方案覆蓋了高質量數據集構建、模型預訓練、微調、強化學習等從模型研發(fā)到場景應用的全流程。
在模型訓練階段,通過行業(yè)首創(chuàng)的領域自約束訓練技術,百川智能實現了模型專項能力和通用能力同步提升的效果,極大提升了模型多元場景的可用性。而Baichuan4-Finance正是這一方案的最新成果,全鏈路金融領域增強讓其既掌握了扎實的金融理論基礎,又具備了豐富的多場景實踐應用能力。
具體而言,Baichuan4-Finance的高質量金融數據集全面且嚴謹,既包含金融專業(yè)教材與學術著作、頂級金融期刊論文、監(jiān)管機構政策文件、金融法律法規(guī)等核心專業(yè)金融知識數據,也覆蓋了金融專業(yè)問答集、企業(yè)財報與年度報告、金融類研究分析報告等實踐應用類數據,為提升模型金融能力提供了良好的底層支撐。
在此基礎上,Baichuan4-Finance還在領域自約束訓練過程中引入了更高精的通用數據,與高質量金融數據一起進行混合訓練,最終實現了模型通用能力不下降,金融能力穩(wěn)定增長的效果。
此外,百川智能在后訓練環(huán)節(jié)也做了大量增強工作,如:通過合成數據、指令數據對模型進行有監(jiān)督的微調;在強化學習策略中,針對數學計算等金融領域特別關注的場景進行樣本增強等,進一步提升了模型性能。
值得一提的是,為了更好地助力金融企業(yè)將大模型應用到各種真實場景,百川智能還在官網發(fā)布了Baichuan4-Finance全鏈路領域增強的技術報告,詳細闡述了包括“領域自約束訓練”在內的各項技術細節(jié)。此舉不僅將極大增強金融行業(yè)對大模型的認知,還將有效提升金融企業(yè)部署大模型的能力與意愿。
據悉,目前百川智能已經服務了數千家客戶,包括北電數智、完美世界游戲、愛奇藝、360集團、生學教育、愛學堂等各行業(yè)的領軍企業(yè),并且與信雅達、用友、軟通動力、新致軟件、達觀數據、華勝天成等多家行業(yè)生態(tài)伙伴,以及華為、中科曙光等硬件廠商,中國移動、中國電信、中國聯通等運營商達成合作,攜手構建百川大模型生態(tài)。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 大模型創(chuàng)企階躍星辰完成數億美元B輪融資 騰訊投資、啟明創(chuàng)投等有投資
- 百川智能發(fā)布全鏈路領域增強金融大模型Baichuan4-Finance,整體準確率領先GPT-4o近20%
- 央視曝光未成年人可輕松繞開“防沉迷”系統:租號玩游戲最低僅需4元
- 知乎發(fā)布2024“年度十問”:《黑神話:悟空》、諾貝爾物理學獎等問題在列
- 李斌回應螢火蟲三重奏大燈設計:沒有參考iPhone
- 一周熱點匯總:特斯拉下月量產改款Model Y,阿里“甩賣”銀泰
- 蔚來第三品牌firefly螢火蟲首款車型正式亮相 預售價14.88萬元
- 首發(fā)線控轉向等多項技術 蔚來旗艦車型ET9正式上市:78.8萬元起
- 網信辦:從嚴打擊網上侵害未成年人合法權益行為
- 豆包大模型全面升級,相關概念股瘋漲,字節(jié)發(fā)布緊急警示
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。