醫(yī)療AI在評估未知患者時(shí)的缺陷

來源:https://www.nature.com/articles/d41586-024-00094-9

醫(yī)生依靠算法進(jìn)行個(gè)性化醫(yī)療,但對精神分裂癥試驗(yàn)的分析表明,這些工具無法適應(yīng)新的數(shù)據(jù)集。

一項(xiàng)研究發(fā)現(xiàn),旨在幫助醫(yī)生治療精神分裂癥患者的計(jì)算機(jī)算法不能很好地適應(yīng)新的、看不見的數(shù)據(jù)。

這些工具使用人工智能(AI)在大型數(shù)據(jù)集中發(fā)現(xiàn)模式,并預(yù)測個(gè)人對特定治療的反應(yīng),是精準(zhǔn)醫(yī)學(xué)的核心,在精準(zhǔn)醫(yī)學(xué)中,醫(yī)療專業(yè)人員試圖為每個(gè)人量身定制治療方法。在1月11日發(fā)表在《科學(xué)》雜志上的研究中,研究人員表明,人工智能模型可以高精度地預(yù)測接受訓(xùn)練的樣本中的人的治療結(jié)果。但當(dāng)應(yīng)用于初始樣本的子集或不同的數(shù)據(jù)集時(shí),它們的性能下降到略好于偶然性。

為了有效性,預(yù)測模型需要在不同的情況下保持一致的準(zhǔn)確性,具有最小的偏差或隨機(jī)結(jié)果。

“這是一個(gè)人們沒有意識到的巨大問題,”研究合著者、康涅狄格州紐黑文耶魯大學(xué)的精神病學(xué)家Adam Chekroud說?!斑@項(xiàng)研究基本上證明了算法需要在多個(gè)樣本上進(jìn)行測試?!?/p>

研究人員評估了一種常用于精神病預(yù)測模型的算法。他們使用了五項(xiàng)抗精神病藥物臨床試驗(yàn)的數(shù)據(jù),涉及北美、亞洲、歐洲和非洲的1513名被診斷為精神分裂癥的參與者。這些試驗(yàn)于2004年至2009年進(jìn)行,測量了參與者在服用三種抗精神病藥物中的一種之前和之后四周的癥狀(或比較同一藥物不同劑量的效果)。

該團(tuán)隊(duì)訓(xùn)練了該算法,以預(yù)測抗精神病藥物治療四周后癥狀的改善。首先,研究人員在開發(fā)該算法的試驗(yàn)中測試了該算法的準(zhǔn)確性——將其預(yù)測與試驗(yàn)中記錄的實(shí)際結(jié)果進(jìn)行比較——發(fā)現(xiàn)準(zhǔn)確性很高。

然后,他們使用了幾種方法來評估模型對新數(shù)據(jù)的泛化能力。研究人員根據(jù)一項(xiàng)臨床試驗(yàn)的數(shù)據(jù)子集對其進(jìn)行訓(xùn)練,然后將其應(yīng)用于同一試驗(yàn)的另一個(gè)子集。他們還根據(jù)一次試驗(yàn)或一組試驗(yàn)的所有數(shù)據(jù)訓(xùn)練算法,然后在另一次試驗(yàn)中測量其性能。

該模型在這些測試中表現(xiàn)不佳,當(dāng)應(yīng)用于未經(jīng)訓(xùn)練的數(shù)據(jù)集時(shí),產(chǎn)生的預(yù)測似乎幾乎是隨機(jī)的。該團(tuán)隊(duì)使用不同的預(yù)測算法重復(fù)了實(shí)驗(yàn),但得到了類似的結(jié)果。

該研究的作者表示,他們的發(fā)現(xiàn)突出了臨床預(yù)測模型應(yīng)如何在大型數(shù)據(jù)集上進(jìn)行嚴(yán)格測試,以確保其可靠性。一項(xiàng)對308個(gè)精神病結(jié)果臨床預(yù)測模型的系統(tǒng)綜述2發(fā)現(xiàn),只有約20%的模型在開發(fā)模型的樣本之外的其他樣本上進(jìn)行了驗(yàn)證。

Chekroud說:“我們應(yīng)該把它看作是藥物開發(fā)?!?。他解釋說,許多藥物在早期臨床試驗(yàn)中顯示出希望,但在后期卻步履蹣跚?!拔覀兇_實(shí)必須對如何構(gòu)建這些算法以及如何測試它們嚴(yán)格遵守紀(jì)律。我們不能只做一次就認(rèn)為這是真實(shí)的。”

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2024-01-13
醫(yī)療AI在評估未知患者時(shí)的缺陷
醫(yī)生依靠算法進(jìn)行個(gè)性化醫(yī)療,但對精神分裂癥試驗(yàn)的分析表明,這些工具無法適應(yīng)新的數(shù)據(jù)集。一項(xiàng)研究發(fā)現(xiàn),旨在幫助醫(yī)生治療精神分裂癥患者的計(jì)算機(jī)算法不能很好地適應(yīng)新的、看不見的數(shù)據(jù)。

長按掃碼 閱讀全文