微軟AI心臟病風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)面世 實(shí)現(xiàn)數(shù)據(jù)可視化指日可待

有許多風(fēng)險(xiǎn)因素決定了人們患心臟病的風(fēng)險(xiǎn),例如生活方式、家族史、職業(yè)、現(xiàn)有疾病等等。了解人們患心臟病的風(fēng)險(xiǎn)可以幫助他們或他們的醫(yī)生優(yōu)先考慮干預(yù)措施。近日,微軟推出了由人工智能支持的心臟病風(fēng)險(xiǎn)評(píng)分API,供大型印度醫(yī)院網(wǎng)絡(luò)Apollo使用。

“世界范圍內(nèi)基于人工智能的模型是在幾十年前形成的,并以西方人口為基礎(chǔ)。我們的新API評(píng)分基于Apollo Hospitals共享的40萬印度人的數(shù)據(jù),可以輕松識(shí)別每位患者的風(fēng)險(xiǎn)水平,“微軟印度總經(jīng)理Anil Bhansali表示?!白鳛?a href="http://ygpos.cn/AI_1.html" target="_blank" class="keylink">AI領(lǐng)域的技術(shù)合作伙伴或?qū)<遥覀兣c醫(yī)療保健提供商和醫(yī)生合作,整合數(shù)據(jù)以幫助構(gòu)建AI模型,”Bhansali補(bǔ)充說。

這個(gè)AI工具考慮了21種風(fēng)險(xiǎn)因素,包括飲食、吸煙和吸煙偏好等生活方式屬性以及通過呼吸率、高血壓、收縮壓和舒張壓反映的心理壓力和焦慮,并將對(duì)治療計(jì)劃提供豐富的見解和早期診斷。

“該評(píng)分將風(fēng)險(xiǎn)分為高、中、低,并提供了對(duì)可修改的最大風(fēng)險(xiǎn)因素的見解,從而幫助醫(yī)生以更全面的方式咨詢患者,同時(shí)為患者提供改善生活方式和及時(shí)干預(yù)的見解?!盉hansali闡述道。印度每年有近300萬心臟病發(fā)病人數(shù),3000萬印度人患有冠心病。

“AI和ML與我們醫(yī)生的全球?qū)I(yè)知識(shí)的合并將有助于預(yù)防心臟病、拯救生命并確?;加行呐K病的人能夠做出明智的健康選擇,”Apollo醫(yī)院常務(wù)董事Sangita Reddy表示。

“印度民眾的心臟風(fēng)險(xiǎn)評(píng)分是精確醫(yī)療保健如何加速預(yù)防心血管疾病和減輕疾病負(fù)擔(dān)的真實(shí)例子,”Bhansali指出。“雖然我們目前正在與Apollo合作,但我們也正在確定合作伙伴,我們可以在其中實(shí)際嘗試此API評(píng)分,”他補(bǔ)充說。

事實(shí)上,微軟并不是第一個(gè)利用AI技術(shù)來預(yù)測(cè)心臟病的機(jī)構(gòu)。在幾個(gè)月前,《科學(xué)》雜志報(bào)道了英國諾丁漢大學(xué)流行病學(xué)家 Stephen Weng 博士團(tuán)隊(duì)發(fā)表在《PLOS ONE》上的重要研究成果,Weng 博士團(tuán)隊(duì)將機(jī)器學(xué)習(xí)算法應(yīng)用于電子病歷的常規(guī)數(shù)據(jù)分析,發(fā)現(xiàn)與當(dāng)前的心臟病預(yù)測(cè)方法相比,深度學(xué)習(xí)算法不僅可以更準(zhǔn)確地預(yù)測(cè)心臟病發(fā)病風(fēng)險(xiǎn),還可以降低假陽性患者數(shù)量 。

「這項(xiàng)研究的重要性再怎么強(qiáng)調(diào)都不過分」,沒有參與這項(xiàng)研究的斯坦福大學(xué)血管外科醫(yī)生 Elsie Ross 博士在接受《科學(xué)》雜志采訪時(shí)表示,「我真的希望醫(yī)生敞開胸懷擁抱人工智能,利用這個(gè)工具更好地幫助患者?!?/p>

我相信大部分心血管醫(yī)生對(duì)人工智能的期待與 Ross 博士一樣。因?yàn)閾?jù)世界衛(wèi)生組織統(tǒng)計(jì),在 2012 年,全球非傳染病導(dǎo)致的死亡人數(shù)為 3800 萬,其中心血管疾?。ㄐ呐K病和中風(fēng)等)為 1750 萬人,占所有非傳染疾病導(dǎo)致死亡病例的 46.2%;而讓人感到畏懼的癌癥導(dǎo)致的死亡為 820 萬,占所有非傳染疾病導(dǎo)致死亡病例的 21.7% 。心血管疾病的預(yù)防與治療確實(shí)刻不容緩。

實(shí)際上科學(xué)家也一直在努力尋找與心腦血管疾病相關(guān)的風(fēng)險(xiǎn)因子,以達(dá)到預(yù)防疾病的目的。例如美國心臟病學(xué)院與美國心臟病協(xié)會(huì)(American College of Cardiology/American Heart Association;ACC/AHA)等機(jī)構(gòu)通過多年的研究,將高血壓、膽固醇、年齡、吸煙和糖尿病等一系列因素列為與心血管疾病風(fēng)險(xiǎn)高相關(guān)的因素,并推出了 ACC/AHA 預(yù)測(cè)模型 。除此之外,還有其他組織機(jī)構(gòu)推出的 QRISK2、Framingham 和 Reynolds 等預(yù)測(cè)模型。

ACC/AHA 的預(yù)測(cè)主要風(fēng)險(xiǎn)因子組合【1】

然而,在 Weng 博士看來,這些方法都不給力。因?yàn)樗袠?biāo)準(zhǔn)的心血管病風(fēng)險(xiǎn)評(píng)估模型都有一個(gè)隱含的假設(shè),即每個(gè)風(fēng)險(xiǎn)因子與心血管疾病之間的關(guān)系都是線性的 ,這些模型可能過度簡化了它們之間的關(guān)系。

相對(duì)于復(fù)雜的生命活動(dòng),這顯然太簡單了,無法揭示患者服用的藥物,或其他疾病和生活方式因素對(duì)疾病的影響。甚至還有一些因素是反直覺的,很多人認(rèn)為脂肪對(duì)身體有害,會(huì)增加健康人患心血管疾病的風(fēng)險(xiǎn)。但在一些情況下,它實(shí)際上是保護(hù)心臟的。「這些例外在人體內(nèi)實(shí)實(shí)在在地發(fā)生,」Weng 博士說?!赣?jì)算科學(xué)給了我們探索那些復(fù)雜關(guān)系的機(jī)會(huì)。」

為了探索利用機(jī)器學(xué)習(xí)預(yù)測(cè)心血管病發(fā)病風(fēng)險(xiǎn)的方法,Weng 博士團(tuán)隊(duì)從 Clinical Practice Research Datalink (CPRD)數(shù)據(jù)庫篩選了 378256 名符合標(biāo)準(zhǔn)居民的 10 年(2005 年 1 月 1 日起)電子病歷,這些居民在 2005 年都是各方面指標(biāo)正常的健康人。

然后隨機(jī)將這個(gè)龐大的數(shù)據(jù)庫分成兩份,其中 295267(78%)個(gè)居民的電子病歷,用來訓(xùn)練機(jī)器學(xué)習(xí)算法,剩下的 82989 個(gè)居民的 10 年電子病歷用來驗(yàn)證算法的準(zhǔn)確性。據(jù) Weng 博士了解,這是全世界范圍內(nèi),首次在如此大規(guī)模的群體中,使用機(jī)器學(xué)習(xí)預(yù)測(cè)人類患心血管疾病的風(fēng)險(xiǎn)。

為了找到更合適的機(jī)器學(xué)習(xí)算法,Weng 博士和其同事采用了 4 種機(jī)器學(xué)習(xí)算法,它們分別是:隨機(jī)森林(random forest)、邏輯回歸(logistic regression)、梯度提升(gradient boosting)和神經(jīng)網(wǎng)絡(luò)(neural networks)。將 ACC/AHA 模型作為對(duì)照。

第一步工作是讓 4 種機(jī)器學(xué)習(xí)算法在沒有人類指示的情況下,通過分析 295267 的電子病歷數(shù)據(jù),各自「創(chuàng)造」一個(gè)預(yù)測(cè)模型。當(dāng)研究人員將標(biāo)準(zhǔn)化的數(shù)據(jù)「喂」給這四種算法之后,它們很快找到了各自認(rèn)為的與心血管病發(fā)生相關(guān)性較高的風(fēng)險(xiǎn)因子。

在這一步,機(jī)器學(xué)習(xí)算法就顯現(xiàn)出了它的優(yōu)勢(shì)。與 ACC/AHA 指南相比,年齡、性別和吸煙三項(xiàng)風(fēng)險(xiǎn)因素,也被四種機(jī)器學(xué)習(xí)算法列為首要風(fēng)險(xiǎn)因素。然而,現(xiàn)行的許多心血管疾病算法認(rèn)為糖尿病是風(fēng)險(xiǎn)因子之一,四種機(jī)器學(xué)習(xí)模型要么不考慮這項(xiàng)因素,要么只認(rèn)為糖化血紅蛋白是風(fēng)險(xiǎn)因素。

四種深度學(xué)習(xí)算法自己「摸索」出來的重要風(fēng)險(xiǎn)因子【1】

更有意思的是,這四種機(jī)器學(xué)習(xí)模型認(rèn)為房顫、種族差異、慢性腎病、慢性阻塞性肺疾病和嚴(yán)重精神病等疾病,以及是否服用皮質(zhì)類固醇,以及甘油三酯水平等生物標(biāo)志物等是重要風(fēng)險(xiǎn)因素。但是這些在現(xiàn)存的模型里都是不存在的。

這再一次表明,機(jī)器學(xué)習(xí)可以幫助研究人員發(fā)現(xiàn)一些潛在的風(fēng)險(xiǎn)因子,這些變量憑人力是很難發(fā)現(xiàn)的,但是機(jī)器學(xué)習(xí)可以從其他變量中推斷出來 。那機(jī)器學(xué)習(xí)的這幾套模型到底靠譜嗎?

第二步,Weng 博士將四種機(jī)器學(xué)習(xí)算法自主建立的模型與 ACC/AHA 模型進(jìn)行比較,讓它們分別預(yù)測(cè)剩下的 82989 個(gè)居民哪些 10 年后會(huì)患心血管疾?。▽?shí)際總發(fā)病人數(shù)為 7404 人,當(dāng)然研究人員沒有把這個(gè)信息告訴深度學(xué)習(xí)模型),哪些不會(huì)發(fā)病。它們的預(yù)測(cè)結(jié)果如下。

四種深度學(xué)習(xí)「摸索」出的模型預(yù)測(cè)能力與 ACC/AHA 模型的比較【1】

不難看出,四種機(jī)器算法自主創(chuàng)建的模型要優(yōu)于 ACC/AHA 模型。隨機(jī)森林模型的敏感性比 ACC/AHA 高出 2.6%,邏輯回歸模型的敏感性比 ACC/AHA 高出 4.4%,梯度提升機(jī)和神經(jīng)網(wǎng)絡(luò)模型的敏感性比 ACC/AHA 高出 4.8%。從本研究的結(jié)果看來,最好的神經(jīng)網(wǎng)絡(luò)算法比傳統(tǒng)模型多正確預(yù)測(cè)了 355 個(gè)居民的發(fā)病風(fēng)險(xiǎn)。這意味著,在更大的人群里,將有數(shù)以萬計(jì)的人會(huì)因此而得救。

實(shí)現(xiàn)數(shù)據(jù)處理過程可視化的方法【1】

然而,我們也不難發(fā)現(xiàn),即使引入深度學(xué)習(xí)算法之后,還有 30% 以上的高風(fēng)險(xiǎn)居民沒有被提前預(yù)測(cè)出來。這意味著深度學(xué)習(xí)算法還需要大幅改進(jìn)。Weng 希望在將來能將更多的生活因素和遺傳因素納入分析范圍,進(jìn)而提升其精確度。

這件事情卻未必那么容易。因?yàn)闄C(jī)器學(xué)習(xí)算法就像「黑箱」,你輸入數(shù)據(jù),它反饋結(jié)果,然而在這個(gè)黑箱之中到底發(fā)生了什么,目前研究人員是很難知道的,這使得科學(xué)家難以在算法上做調(diào)整。不過,科學(xué)家正在努力改進(jìn)這一現(xiàn)狀,爭取實(shí)現(xiàn)數(shù)據(jù)處理過程的可視化 。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2018-08-21
微軟AI心臟病風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)面世 實(shí)現(xiàn)數(shù)據(jù)可視化指日可待
有許多風(fēng)險(xiǎn)因素決定了人們患心臟病的風(fēng)險(xiǎn),例如生活方式、家族史、職業(yè)、現(xiàn)有疾病等等。了解人們患心臟病的風(fēng)險(xiǎn)可以幫助他們或他們的醫(yī)生優(yōu)先考慮干預(yù)措施。

長按掃碼 閱讀全文