第一!醫(yī)渡科技大模型登頂上海AI實驗室權(quán)威評測榜

5月9日,面向中文醫(yī)療大語言模型的開放評測平臺MedBench更新評測榜單,醫(yī)渡科技大模型(評測名:HH-YIDU-Med)以綜合得分61.3分的出色成績登頂榜首,成為榜單中首個綜合評分超過60的醫(yī)療大模型。

MedBench評測榜單節(jié)選

MedBench是由上海AI實驗室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心推出的權(quán)威評測平臺,依托頂級醫(yī)療機(jī)構(gòu)的專家經(jīng)驗和知識儲備,設(shè)置了醫(yī)學(xué)語言理解、醫(yī)學(xué)語言生成、醫(yī)學(xué)知識問答、復(fù)雜醫(yī)學(xué)推理和醫(yī)療安全和倫理等5大維度,共包含15項任務(wù)、20個數(shù)據(jù)集及30萬道題目,為中文醫(yī)療大模型提供客觀科學(xué)的性能評測參考。

MedBench榜單評測維度

醫(yī)療行業(yè)因其獨(dú)有的專業(yè)度和嚴(yán)謹(jǐn)性,對醫(yī)療大模型的能力提出了極高要求。盡管GPT-4已經(jīng)在通用大模型領(lǐng)域取得了顯著的突破,但由于醫(yī)療文本和知識的特殊性,即使是GPT-4在處理醫(yī)療場景的真實問題時,如果未經(jīng)專門訓(xùn)練也無法取得很好的成績。醫(yī)渡科技大模型在醫(yī)學(xué)知識問答、醫(yī)學(xué)語言理解、醫(yī)療安全和倫理三大關(guān)鍵維度中都拔得頭籌,充分展現(xiàn)了其在專業(yè)性、理解力、邏輯性和安全性等方面的醫(yī)療專業(yè)實力。

作為國內(nèi)醫(yī)療智能行業(yè)的頭部企業(yè),醫(yī)渡科技在醫(yī)療智能領(lǐng)域深耕近10年,其“醫(yī)療智能大腦”YiduCore經(jīng)授權(quán)處理分析了超過40多億份醫(yī)療記錄,沉淀了大量多維度可量化的知識圖譜。醫(yī)渡科技大模型的構(gòu)建不僅基于對大量臨床實踐指南、醫(yī)學(xué)文獻(xiàn)的篩選治理,還應(yīng)用自研的數(shù)據(jù)生成技術(shù),將多年實踐積累的知識圖譜用于大模型訓(xùn)練,從而顯著提升了模型在醫(yī)學(xué)領(lǐng)域的專業(yè)性能和準(zhǔn)確性,增強(qiáng)了大模型生成內(nèi)容的真實性和可解釋性。

醫(yī)渡科技大模型的優(yōu)秀表現(xiàn),得益于公司在醫(yī)療知識和知識圖譜方面的積累,也離不開其在模型架構(gòu)和算法方面的不斷創(chuàng)新。醫(yī)渡科技具備從硬件組網(wǎng)到訓(xùn)練微調(diào)、推理的完整技術(shù)能力,國內(nèi)外主流芯片軟硬件全棧適配。并且自研了針對醫(yī)療數(shù)據(jù)特點(diǎn)的專利技術(shù),進(jìn)一步提升了模型在醫(yī)學(xué)語言理解、醫(yī)療安全等方面的專業(yè)能力。此外,醫(yī)渡科技還采用了數(shù)據(jù)增強(qiáng)和對抗訓(xùn)練等技術(shù),以提升模型的魯棒性。

作為“醫(yī)療大腦”YiduCore的核心算法,醫(yī)渡科技大模型為醫(yī)療健康產(chǎn)業(yè)各應(yīng)用場景提供易使用、高質(zhì)量、可定制的強(qiáng)大賦能。面向B端,醫(yī)渡科技大模型能夠利用強(qiáng)大的專業(yè)能力助力“醫(yī)、教、研、管”等場景各個環(huán)節(jié)提質(zhì)增效,公司原有的數(shù)據(jù)治理、醫(yī)院管理、臨床科研、臨床診療等多個場景的解決方案都基于大模型技術(shù)進(jìn)行了升級;面向C端用戶,醫(yī)渡科技大模型提供專業(yè)醫(yī)學(xué)級別的個性化服務(wù),包括報告解讀、健康問答、導(dǎo)診咨詢等等。目前醫(yī)渡科技大模型正由大語言模型向多模態(tài)大模型升級,從而滿足更多場景的應(yīng)用需求。

此次登頂MedBench評測榜,醫(yī)渡科技大模型從理解生成“基礎(chǔ)”能力,到復(fù)雜推理“進(jìn)階”能力,再到倫理把控“高級”能力的模型性能都得到了驗證和肯定。醫(yī)渡科技表示,目前取得的成績只是一個開始,醫(yī)療大模型還有很長的路要走。公司將繼續(xù)穩(wěn)步前行,不斷突破創(chuàng)新,以實現(xiàn)醫(yī)療人工智能的更大潛力,推動大模型技術(shù)向更高水平發(fā)展,實現(xiàn)大模型技術(shù)在多領(lǐng)域場景下的滲透和應(yīng)用,加速推動醫(yī)療行業(yè)的智能化轉(zhuǎn)型升級。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )