1月24日消息,據(jù)百川大模型公眾號消息,百川智能發(fā)布了國內(nèi)首個全場景深度思考模型Baichuan-M1-preview。該模型是國內(nèi)目前唯一同時具備語言、視覺和搜索三大領(lǐng)域推理能力的模型。在數(shù)學(xué)、代碼等多個權(quán)威評測中,Baichuan-M1-preview的表現(xiàn)均超越了o1-preview,展現(xiàn)了其在多領(lǐng)域推理方面的獨(dú)特優(yōu)勢。
此外,作為國內(nèi)唯一專注醫(yī)療領(lǐng)域的頭部大模型公司推出的深度思考模型,它還解鎖了醫(yī)療循證模式,實(shí)現(xiàn)了從醫(yī)療證據(jù)檢索到深度推理的完整端到端服務(wù),能夠快速、精準(zhǔn)地回答醫(yī)療臨床、科研問題。
Baichuan-M1-preview現(xiàn)已在百小應(yīng)中正式上線,在深度思考模式下不僅能準(zhǔn)確解答數(shù)學(xué)、代碼、邏輯推理等問題,面對復(fù)雜醫(yī)療問題,還能像資深醫(yī)療專家一樣,通過深度思考構(gòu)建嚴(yán)謹(jǐn)?shù)尼t(yī)學(xué)推理過程,為用戶提供全面的疾病分析和個性化健康管理建議。
為了更好地繁榮AI醫(yī)療生態(tài),助力醫(yī)療事業(yè)發(fā)展,百川智能還同時推出了行業(yè)首個開源醫(yī)療增強(qiáng)大模型Baichuan-M1-14B,其醫(yī)療能力超越了更大參數(shù)量的Qwen2.5-72B,與o1-mini相差無幾。
多項(xiàng)能力超越o1-preview,解鎖醫(yī)療循證模式
作為一個全場景深度思考模型,Baichuan-M1-preview的能力全面,具備強(qiáng)大的語言推理、視覺推理及搜索推理能力。語言推理方面,其在AIME和Math等數(shù)學(xué)基準(zhǔn)測試,以及LiveCodeBench代碼任務(wù)上的成績均超越了o1-preview等模型。
視覺推理方面,在MMMU-val、MathVista等權(quán)威評測中的成績,超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等國內(nèi)外頭部模型。
Baichuan-M1-preview的另一大亮點(diǎn)是解鎖了醫(yī)療循證模式。在面對復(fù)雜醫(yī)學(xué)問題時,會將專業(yè)可靠的醫(yī)療知識作為推理依據(jù),幫助用戶做出最佳的醫(yī)療決策。
為實(shí)現(xiàn)這一能力,百川智能自建了涵蓋億級條目的循證醫(yī)學(xué)知識庫,囊括了國內(nèi)外海量醫(yī)學(xué)論文、權(quán)威指南、專家共識、疾病與癥狀解析、藥品說明等專業(yè)醫(yī)療內(nèi)容,且以天為單位進(jìn)行動態(tài)更新,及時收錄醫(yī)療領(lǐng)域的新突破、新進(jìn)展。
眾所周知,醫(yī)學(xué)知識多樣性強(qiáng)、因果關(guān)系復(fù)雜。因此,即使構(gòu)建了龐大的醫(yī)療知識庫,在調(diào)用其中的醫(yī)學(xué)知識,尤其疊加了互聯(lián)網(wǎng)上搜索到的醫(yī)療信息時依然會遇到部分醫(yī)學(xué)數(shù)據(jù)、醫(yī)學(xué)理論不一致的情況。
針對這一問題,醫(yī)療循證模式能運(yùn)用醫(yī)學(xué)知識和證據(jù)評估標(biāo)準(zhǔn),對證據(jù)進(jìn)行多層分級,并對不同權(quán)威等級的證據(jù)進(jìn)行專業(yè)分析與整合,精準(zhǔn)識別各類權(quán)威信息的來源和可信度,從而避免因信息混雜導(dǎo)致的誤判,然后基于這些醫(yī)學(xué)證據(jù)進(jìn)行可靠、準(zhǔn)確的醫(yī)學(xué)推理,最終提供可信賴的醫(yī)療答案。
通過“醫(yī)療循證模式”,Baichuan-M1-preview實(shí)現(xiàn)了從證據(jù)檢索到深度推理的完整端到端服務(wù),能夠有效地解決醫(yī)療場景中信息過載、不確定性和碎片化等痛點(diǎn)。無論是醫(yī)生面對復(fù)雜病案,還是患者尋求權(quán)威建議,它都能通過“擺事實(shí)、講道理”的循證方式提供言之有物、有理有據(jù)的解答。不僅能在臨床場景中幫助醫(yī)生提升診療效率,在醫(yī)學(xué)科研場景中大幅縮短科研探索時間,還能幫助普通用戶更好地理解自身健康狀況,幫助患者科學(xué)管理生活方式,提升治療效果。
行業(yè)首個開源醫(yī)療增強(qiáng)通用大模型 ,Baichuan-M1-14B醫(yī)療能力超越Qwen2.5-72B
為了推動AI技術(shù)在醫(yī)療領(lǐng)域的創(chuàng)新發(fā)展,增強(qiáng)AI醫(yī)療技術(shù)的透明度和可信性,提高醫(yī)療服務(wù)的可及性,繁榮AI醫(yī)療生態(tài),百川智能還開源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。
作為行業(yè)首個開源醫(yī)療增強(qiáng)通用大模型Baichuan-M1-14B的表現(xiàn)非常優(yōu)異,不僅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等權(quán)威醫(yī)學(xué)知識和臨床能力評測上的成績超越了更大參數(shù)量的Qwen2.5-72B-Instruct,并且與o1-mini也相差無幾。
為了提升Baichuan-M1-14B的醫(yī)療能力,百川智能多管齊下:數(shù)據(jù)構(gòu)建方面,面向細(xì)分醫(yī)療場景,收集了萬億級 token 的嚴(yán)肅醫(yī)療數(shù)據(jù),涵蓋了千萬級的中/英文專業(yè)醫(yī)療論文、院內(nèi)真實(shí)中/英文醫(yī)療病例,億級的醫(yī)療問答、醫(yī)療問診、臨床數(shù)據(jù)等,還對全網(wǎng)數(shù)據(jù)進(jìn)行了包括醫(yī)療科室、醫(yī)療內(nèi)容以及醫(yī)療價值在內(nèi)的分類評估,確保模型能學(xué)習(xí)到有價值且全面的醫(yī)療知識。
在此基礎(chǔ)上,百川智能還針對病例、醫(yī)學(xué)教材、醫(yī)學(xué)指南等不同類別的高質(zhì)量醫(yī)療數(shù)據(jù)生成了超千億 token 的多樣化數(shù)據(jù),包含了醫(yī)療復(fù)雜決策推理鏈條、決策依據(jù)以及問答對等多樣化形式。這些合成數(shù)據(jù)擁有豐富的知識呈現(xiàn)形式以及與醫(yī)生一致的思維過程,進(jìn)一步強(qiáng)化了Baichuan-M1-14B的醫(yī)學(xué)知識能力和醫(yī)療推理能力。
進(jìn)入到模型訓(xùn)練階段,百川智能運(yùn)用行業(yè)首創(chuàng)的多階段領(lǐng)域提升方案,將整個訓(xùn)練過程分為通識提升、醫(yī)療基礎(chǔ)知識提升、醫(yī)療進(jìn)階知識提升三個階段,依次提升模型的基礎(chǔ)語言、高階及疑難病癥應(yīng)對等能力。此外還在 CoT 訓(xùn)練框架中創(chuàng)新的引入了ELO強(qiáng)化學(xué)習(xí)法,優(yōu)化思維鏈路徑,避免傳統(tǒng)獎勵模型偏差,有效提升了模型的生成質(zhì)量與邏輯推理能力。
Baichuan-M1-preview是百川智能在AI醫(yī)療領(lǐng)域的又一次重要突破,為其實(shí)現(xiàn)“造醫(yī)生、改路徑、促醫(yī)學(xué)”的AI醫(yī)療愿景提供了有力支撐。于此同時,Baichuan-M1-14B開源模型則為中國AI醫(yī)療健康生態(tài)建設(shè)提供了強(qiáng)大助力。百川智能不僅希望加速AI技術(shù)在醫(yī)療領(lǐng)域的廣泛應(yīng)用,更旨在激發(fā)更多創(chuàng)新力量,共同推動中國醫(yī)療健康生態(tài)的持續(xù)進(jìn)步,助力實(shí)現(xiàn)更公平、更高效的高質(zhì)量醫(yī)療服務(wù)。
- 獨(dú)家對話尚網(wǎng)網(wǎng)絡(luò)CEO朱立華:再造線下經(jīng)濟(jì)新繁榮
- 消息稱智譜管理層變動 2名高管離職
- SM娛樂單方面通知網(wǎng)易云音樂不續(xù)約 行業(yè)預(yù)估波及數(shù)百萬用戶
- 特斯拉中國召回超120萬輛進(jìn)口及國產(chǎn)汽車
- 小米首次召回3.1萬輛SU7標(biāo)準(zhǔn)版車型 OTA升級即可解決
- 解碼機(jī)器人技術(shù)未來:英偉達(dá)推動智能與產(chǎn)業(yè)融合
- 網(wǎng)易云音樂或?qū)⑾录躍M娛樂版權(quán)歌曲 行業(yè)預(yù)估波及數(shù)百萬用戶
- 百川智能發(fā)布全場景深度思考模型Baichuan-M1-preview:聚齊三大推理能力,解鎖醫(yī)療循證模式
- 抖音上線打車服務(wù) 目前僅高德打車一家入駐
- 好未來2025財年第三季度凈利潤2310萬美元,同比扭虧
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。