運(yùn)籌新數(shù)據(jù),中山大學(xué)精準(zhǔn)醫(yī)學(xué)中心的新存儲(chǔ)之道

什么叫精準(zhǔn)醫(yī)學(xué)?

百科是這樣定義的:精準(zhǔn)醫(yī)學(xué)(Precision Medicine)是以個(gè)體化醫(yī)療為基礎(chǔ)、隨著基因組測(cè)序技術(shù)快速進(jìn)步以及生物信息與大數(shù)據(jù)科學(xué)的交叉應(yīng)用而發(fā)展起來(lái)的新型醫(yī)學(xué)概念與醫(yī)療模式。

定義可能過(guò)于學(xué)術(shù)化,不易于理解,來(lái)看看現(xiàn)實(shí)中經(jīng)常遇到的例子:A和B同時(shí)患有某種腫瘤疾病,同樣的藥物對(duì)于A有效,但對(duì)于B卻沒(méi)有效果,反而會(huì)影響到B的病情;C和D患有不同腫瘤疾病,卻通過(guò)同樣的藥物讓病情得到極大緩解。類(lèi)似情況在癌癥、腫瘤等疾病領(lǐng)域經(jīng)常出現(xiàn),個(gè)體因?yàn)檫z傳基因、所處環(huán)境和生活方式的不同,在治療反應(yīng)性上存在著很大的差異。

精準(zhǔn)醫(yī)學(xué)的出現(xiàn),改變過(guò)去“一刀切”的治療方法,通過(guò)整合基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)以及相關(guān)環(huán)境與生活方式等大數(shù)據(jù)信息,為患者精準(zhǔn)制定最有效治療方案。事實(shí)上,從最早的經(jīng)驗(yàn)醫(yī)學(xué)到循證醫(yī)學(xué),再到如今的精準(zhǔn)醫(yī)學(xué),醫(yī)療模式走向數(shù)字化、精準(zhǔn)化已成必然趨勢(shì)。

要實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué),先決條件在于構(gòu)建一個(gè)巨大的“疾病知識(shí)網(wǎng)絡(luò)”,其中關(guān)鍵在于數(shù)據(jù)和大數(shù)據(jù)平臺(tái):數(shù)據(jù)越豐富、維度越全面,意味著治療方案的決策正確性就越高;大數(shù)據(jù)平臺(tái)性能強(qiáng)、穩(wěn)定性高、可靠性出色,則可以支撐起整個(gè)精準(zhǔn)醫(yī)學(xué)的長(zhǎng)期研究。

那么,精準(zhǔn)醫(yī)學(xué)的業(yè)務(wù)需求有哪些特點(diǎn),數(shù)據(jù)特征情況如何,對(duì)于大數(shù)據(jù)平臺(tái)建設(shè)又有哪些核心訴求?作為中國(guó)精準(zhǔn)醫(yī)學(xué)發(fā)展的先行者,中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心自籌建伊始就確定了建立醫(yī)學(xué)大數(shù)據(jù)中心,以大數(shù)據(jù)平臺(tái)作為核心基礎(chǔ)設(shè)施,來(lái)采集、存儲(chǔ)、管理和利用數(shù)據(jù),為精準(zhǔn)醫(yī)學(xué)發(fā)展打了個(gè)樣。

一個(gè)影響未來(lái)五年的選擇題

從2015年起,中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心開(kāi)始籌建,首先需要面臨三件大事:成立樣本庫(kù)、建立醫(yī)學(xué)大數(shù)據(jù)中心和搭建精準(zhǔn)醫(yī)學(xué)實(shí)驗(yàn)技術(shù)平臺(tái)。如果從數(shù)字化的角度來(lái)看,成立樣本庫(kù)相當(dāng)于構(gòu)建起一個(gè)醫(yī)療相關(guān)數(shù)據(jù)集合庫(kù);建立醫(yī)學(xué)大數(shù)據(jù)中心則是為了采集、存儲(chǔ)、管理整個(gè)數(shù)據(jù);而精準(zhǔn)醫(yī)學(xué)實(shí)驗(yàn)技術(shù)平臺(tái)負(fù)責(zé)數(shù)據(jù)價(jià)值最終的輸出。

在三件事情中,醫(yī)學(xué)大數(shù)據(jù)中心的建設(shè)雖然是最底層范疇,卻屬于新基建中典型的創(chuàng)新基礎(chǔ)設(shè)施,起到支撐起整個(gè)科學(xué)研究運(yùn)轉(zhuǎn)的關(guān)鍵作用。中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心在建設(shè)醫(yī)學(xué)大數(shù)據(jù)中心時(shí),面臨著架構(gòu)的選擇,“第一個(gè)是超融合架構(gòu),另一個(gè)則是采用存算分離架構(gòu)。”中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)高級(jí)工程師肖華鋒如是說(shuō),“架構(gòu)的選擇關(guān)系著未來(lái)五年醫(yī)學(xué)大數(shù)據(jù)平臺(tái)能否有效支撐起精準(zhǔn)醫(yī)學(xué)業(yè)務(wù)研究?!?/p>

中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái) 高級(jí)工程師肖華鋒

彼時(shí)的超融合正是基礎(chǔ)架構(gòu)領(lǐng)域冉冉升起的明星,受到了業(yè)界、用戶(hù)們的廣泛關(guān)注,憑借簡(jiǎn)化的架構(gòu)、強(qiáng)大的并發(fā)性能以及便捷的管理等優(yōu)勢(shì),被認(rèn)為是基礎(chǔ)設(shè)施建設(shè)的首選。但是,中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心經(jīng)過(guò)對(duì)精準(zhǔn)醫(yī)學(xué)數(shù)據(jù)類(lèi)型、業(yè)務(wù)特征以及未來(lái)應(yīng)用規(guī)劃進(jìn)行仔細(xì)和反復(fù)的調(diào)研之后,最終選擇了存算分離架構(gòu)來(lái)構(gòu)建醫(yī)學(xué)大數(shù)據(jù)中心。

為什么會(huì)舍棄超融合,選擇存算分離的架構(gòu)?肖華鋒解釋道:“當(dāng)時(shí)決策原因有兩點(diǎn):一是成本,當(dāng)時(shí)超融合成本高,每個(gè)節(jié)點(diǎn)必須配置SSD,加上License費(fèi)用,采購(gòu)成本較高;第二則是從場(chǎng)景適用上考慮,精準(zhǔn)醫(yī)學(xué)科學(xué)中心場(chǎng)景中,存儲(chǔ)需求增長(zhǎng)速度遠(yuǎn)超過(guò)計(jì)算,超融合擴(kuò)展是計(jì)算與存儲(chǔ)等比例擴(kuò)展,存算分離架構(gòu)反而會(huì)帶來(lái)更加靈活的擴(kuò)展方式?!?/p>

那么,醫(yī)學(xué)大數(shù)據(jù)中心采用存算分離架構(gòu)之后,真實(shí)情況會(huì)不會(huì)出現(xiàn)“理想很豐滿(mǎn),現(xiàn)實(shí)很骨干”的窘境?

讓理想照進(jìn)現(xiàn)實(shí)

從2016年開(kāi)始,中山大學(xué)精準(zhǔn)醫(yī)學(xué)中心開(kāi)展生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)工作,核心是建成數(shù)據(jù)匯交、清洗整合、存儲(chǔ)管理、共享交換、隱私保護(hù)、開(kāi)放共享的醫(yī)學(xué)大數(shù)據(jù)和生命組學(xué)數(shù)據(jù)兩大數(shù)據(jù)庫(kù),并開(kāi)展醫(yī)學(xué)大數(shù)據(jù)互聯(lián)共享工程,建立數(shù)據(jù)標(biāo)準(zhǔn)體系和安全體系,實(shí)現(xiàn)患者醫(yī)學(xué)數(shù)據(jù)跨系統(tǒng)/區(qū)域互聯(lián)互認(rèn)、數(shù)據(jù)共享工作。

“中山大學(xué)精準(zhǔn)醫(yī)學(xué)中心生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)真正意義上把附屬醫(yī)院的數(shù)據(jù)和中心實(shí)現(xiàn)互聯(lián)互通,并實(shí)現(xiàn)了數(shù)據(jù)交互和存儲(chǔ)?!毙とA鋒介紹道,“不過(guò),數(shù)據(jù)增長(zhǎng)的確是太快啦?!?/p>

建設(shè)之初,生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)規(guī)劃了浪潮500TB集中式SAN存儲(chǔ)來(lái)承載精準(zhǔn)醫(yī)學(xué)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)的檢索、360隨身檔案系統(tǒng)等核心業(yè)務(wù)應(yīng)用,目前使用近半;規(guī)劃1PB 浪潮分布式存儲(chǔ)AS13000來(lái)存儲(chǔ)海量影像數(shù)據(jù),隨著業(yè)務(wù)數(shù)據(jù)的采集量的增加,不到3年時(shí)間,中心的影像存儲(chǔ)已經(jīng)擴(kuò)展到了2PB。

浪潮存儲(chǔ)產(chǎn)品

在有海量存儲(chǔ)為數(shù)據(jù)增長(zhǎng)帶來(lái)的容量挑戰(zhàn)兜底之后,如何應(yīng)對(duì)數(shù)據(jù)應(yīng)用帶來(lái)的挑戰(zhàn)又是一個(gè)難題?!爸行牡臄?shù)據(jù)在沒(méi)有科研任務(wù)的時(shí)候基本都是冷數(shù)據(jù),而當(dāng)課題介入,研究人員需要檢索和分析數(shù)據(jù)時(shí),往往周期又很長(zhǎng),可能長(zhǎng)達(dá)半個(gè)月。此時(shí),又希望數(shù)據(jù)是熱的?!毙とA鋒介紹道。好在浪潮存儲(chǔ)過(guò)去四年一直都平穩(wěn)運(yùn)行,在容量和性能上都滿(mǎn)足了需求。

未來(lái)需要新存儲(chǔ)之道

隨著生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)和生物樣本庫(kù)逐漸完善,精準(zhǔn)醫(yī)學(xué)相關(guān)研究與業(yè)務(wù)開(kāi)始步入快車(chē)道,醫(yī)學(xué)大數(shù)據(jù)中心在存儲(chǔ)上未來(lái)又面臨著新的訴求與挑戰(zhàn)。

首先是數(shù)據(jù)的增長(zhǎng)速度和增長(zhǎng)量會(huì)比以往還要大,尤其是生物樣本庫(kù)建好之后,中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心的多組學(xué)研究平臺(tái)將以此構(gòu)建起來(lái),包括代謝組學(xué)、基因組學(xué)等,這些應(yīng)用的上線(xiàn)與加碼將進(jìn)一步帶來(lái)數(shù)據(jù)爆炸性的增長(zhǎng)。肖華鋒坦言:“中心的三個(gè)基礎(chǔ)平臺(tái)、兩個(gè)研究平臺(tái)和一個(gè)應(yīng)用平臺(tái)整體布局逐漸完善之后,預(yù)計(jì)存儲(chǔ)一年擴(kuò)展10P將會(huì)成為一種常態(tài)?!?/p>

另外,生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)基于人工智能相關(guān)的醫(yī)學(xué)研究正在迅速增加,對(duì)于存儲(chǔ)容量和性能提出更高挑戰(zhàn)。

“中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心是當(dāng)下用戶(hù)對(duì)于存儲(chǔ)容量和性能訴求的一個(gè)典型代表?!崩顺贝鎯?chǔ)資深架構(gòu)師葉毓睿如是說(shuō):“面對(duì)一個(gè)數(shù)字化的智慧時(shí)代加速到來(lái),浪潮提出了新存儲(chǔ)之道,讓存儲(chǔ)朝著EB級(jí)容量、億級(jí)IOPS、TB級(jí)帶寬等新能力加速演進(jìn),來(lái)滿(mǎn)足用戶(hù)不斷增長(zhǎng)的需求?!?/p>

肖華鋒與葉毓睿接受大數(shù)據(jù)在線(xiàn)采訪

其次,中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心醫(yī)學(xué)大數(shù)據(jù)中心還將面臨著新舊設(shè)備混用、不同廠商設(shè)備混用的情況,加上其數(shù)據(jù)量不斷提升,設(shè)備數(shù)量也會(huì)隨之增加,如何發(fā)揮各種設(shè)備的性能以及如何運(yùn)維管理各種設(shè)備就成為極大的挑戰(zhàn)。肖華鋒直言:“我們中心運(yùn)維人員很少,醫(yī)學(xué)數(shù)據(jù)類(lèi)三級(jí)等保對(duì)運(yùn)維又有著極為嚴(yán)格的要求,迫切需要智能運(yùn)維技術(shù)來(lái)減輕壓力?!?/p>

事實(shí)上,存儲(chǔ)融入AI技術(shù)加速走向智能化正在成為趨勢(shì)。存儲(chǔ)根據(jù)業(yè)務(wù)負(fù)載、運(yùn)維管理等數(shù)據(jù)特征,進(jìn)行不斷的學(xué)習(xí)與優(yōu)化,從而提供更加精準(zhǔn)的預(yù)警信息和執(zhí)行動(dòng)作,讓自身運(yùn)維與管理走向智能化。葉毓睿介紹:“以浪潮存儲(chǔ)為例,iTurbo智用引擎可以通過(guò)智能IO感知、智能多路徑、智能數(shù)據(jù)組織、智能資源調(diào)度四大核心技術(shù)為業(yè)務(wù)應(yīng)用提速;而智能統(tǒng)一存儲(chǔ)管理平臺(tái)InView則提供了性能容量預(yù)測(cè)分析、磁盤(pán)故障預(yù)測(cè)與定位等一系列智能化功能,規(guī)避硬件故障帶來(lái)的風(fēng)險(xiǎn)和損失,有效降低運(yùn)維壓力?!?/p>

總體來(lái)看,精準(zhǔn)醫(yī)學(xué)依然處于起步的初期,中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心作為先行者,對(duì)于醫(yī)學(xué)大數(shù)據(jù)中心的建設(shè)有著深刻的認(rèn)知,并且在架構(gòu)選擇上做出了明智的選擇。未來(lái),隨著精準(zhǔn)醫(yī)學(xué)研究的不斷深入,中山大學(xué)精準(zhǔn)醫(yī)學(xué)科學(xué)中心對(duì)于衍生出來(lái)的新存儲(chǔ)需求與挑戰(zhàn)也有著清晰的判斷,其精準(zhǔn)醫(yī)學(xué)研究有望開(kāi)啟新局面,值得精準(zhǔn)醫(yī)學(xué)的同仁借鑒與學(xué)習(xí)。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2020-11-05
運(yùn)籌新數(shù)據(jù),中山大學(xué)精準(zhǔn)醫(yī)學(xué)中心的新存儲(chǔ)之道
肖華鋒解釋道:“當(dāng)時(shí)決策原因有兩點(diǎn):一是成本,當(dāng)時(shí)超融合成本高,每個(gè)節(jié)點(diǎn)必須配置SSD,加上License費(fèi)用,采購(gòu)成本較高;第二則是從場(chǎng)景適用上考慮,精準(zhǔn)醫(yī)學(xué)科學(xué)中心場(chǎng)景中,存儲(chǔ)需求增長(zhǎng)速度遠(yuǎn)超過(guò)計(jì)

長(zhǎng)按掃碼 閱讀全文