一場(chǎng)新型冠狀病毒肺炎疫情,牽動(dòng)舉國(guó)上下。在廣大的醫(yī)務(wù)人員奮戰(zhàn)一線的同時(shí),一大批“科技力量”也加入了抗擊疫情的最前線。
在未知病毒以“不明原因肺炎”進(jìn)入公眾視野時(shí),科研人員已經(jīng)開始嘗試破譯病毒的基因數(shù)據(jù)。病毒基因組,是病毒的生命密碼。借助于分子生物技術(shù),病原學(xué)專家通過對(duì)病毒標(biāo)本進(jìn)行測(cè)定,這樣的破譯,最早在2020年1月2日就已完成。隨后,中科院武漢病毒所、中國(guó)疾控中心病毒所、上海市公共衛(wèi)生臨床中心分別于1月2日、1月3日、1月5日凌晨,獲得病毒全基因組序列。
那么,病毒基因究竟是如何被一步步解析的?這其中高性能計(jì)算(HPC)平臺(tái)又起到什么樣的作用?來看看浪潮生命科學(xué)行業(yè)方案專家的解讀。
Q:能否舉例子介紹一下新冠病毒基因是如何被測(cè)定和解析的?
目前,在獲取病毒基因組序列方面,廣泛應(yīng)用高通量測(cè)序技術(shù)來完成,這種方式是將核酸序列打斷成短片段進(jìn)行測(cè)序,通過分析軟件將測(cè)得的短序列進(jìn)行拼接組裝。對(duì)于新發(fā)病毒,在序列組裝過程中會(huì)面臨更多難點(diǎn),因?yàn)樵跍y(cè)序深度、測(cè)序準(zhǔn)確性、重復(fù)序列比例等方面沒有可供參考的經(jīng)驗(yàn)值,這就需要將海量的短序列還原出原始的基因組序列。在序列拼裝中還可能會(huì)出現(xiàn)測(cè)序錯(cuò)誤,拼接的準(zhǔn)確性和完整性不高,拼接難度更高。所以,解析新冠病毒序列,需要在建庫、高通量測(cè)序、序列組裝、變異進(jìn)化分析等多個(gè)流程加以管理。
新冠病毒序列組裝解決方案示意
比如在建庫環(huán)節(jié)中,對(duì)核酸含量高的樣本進(jìn)行rRNA去除再建庫,提高有效數(shù)據(jù)占比;對(duì)核酸含量低的樣本,直接進(jìn)行RNA建庫,減少核酸損失,提升建庫成功率,并加大測(cè)序深度。在測(cè)序環(huán)節(jié)采用更高效專注的測(cè)序儀,最后,通過病原鑒定系統(tǒng)對(duì)新冠病毒序列進(jìn)行數(shù)據(jù)分析并采用IDBA方法完成拼接。這樣可以滿足宏轉(zhuǎn)錄組測(cè)序病毒序列組裝對(duì)數(shù)據(jù)量的要求,保證序列信息的完整性。
我們來還原一下某疾控中心收到的1例新冠病毒肺炎疑似樣本,解析新型冠狀病毒感染病例呼吸道標(biāo)本宏轉(zhuǎn)錄組測(cè)序及病毒序列組裝的流程:
病毒全基因組序列獲取流程
? 首先是文庫制備。針對(duì)核酸量不同的樣本,采用不同的建庫策略。經(jīng)反轉(zhuǎn)錄、接頭連接、PCR擴(kuò)增、純化等一系列操作后獲得文庫產(chǎn)物,再使用滾環(huán)擴(kuò)增技術(shù),制備DNA納米球。
? 第二步,上機(jī)測(cè)序。對(duì)病例的呼吸道標(biāo)本進(jìn)行高深度測(cè)序。
? 第三步,數(shù)據(jù)分析。產(chǎn)出32Gb數(shù)據(jù),總序列數(shù)318M。結(jié)合病原感染快速鑒定系統(tǒng),鑒定出230萬余條新型冠狀病毒序列。
? 最后,拼接組裝。分析軟件會(huì)自動(dòng)將230萬條的新型冠狀病毒序列從所有序列中抽出。使用拼接效率高的IDBA方法進(jìn)行組裝,成功完成新型冠狀病毒的序列組裝,獲得基因組序列。
Q:在冠狀病毒解析過程中,HPC平臺(tái)起到了那些作用?
在尋找病毒來源、獲知病毒結(jié)構(gòu)、篩選抗毒小分子方面HPC算力都發(fā)揮了重要的作用。例如在病毒分析領(lǐng)域常用的冷凍電鏡三維重構(gòu)技術(shù),在低溫環(huán)境下利用透射電子顯微鏡對(duì)樣品進(jìn)行成像,再經(jīng)圖像處理和重構(gòu)計(jì)算獲得樣品的三維結(jié)構(gòu)。在整個(gè)流程中,數(shù)據(jù)采集、圖像處理、三維重構(gòu)是非常核心的三個(gè)步驟,對(duì)計(jì)算和存儲(chǔ)的需求非常高。病毒顆粒結(jié)構(gòu)的解析,其電鏡圖像的數(shù)據(jù)量可高達(dá)數(shù)TB,且病毒顆粒相對(duì)蛋白質(zhì)顆粒要大得多,在計(jì)算上單一進(jìn)程就需要128GB的內(nèi)存,那么一臺(tái)計(jì)算節(jié)點(diǎn)就需要至少4TB的內(nèi)存支持。在算法上,基于中央截面定理的重構(gòu)過程依賴大量的單精度或雙精度快速傅里葉(FFT)計(jì)算,需要海量算力資源來支持。
在實(shí)際應(yīng)用上,中科院生物物理所與浪潮-Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室合作開展的基于MIC異構(gòu)架構(gòu)電子斷層三維重構(gòu)技術(shù)(Electron Tomography,簡(jiǎn)稱ET)應(yīng)用研究。研究團(tuán)隊(duì)共同開發(fā)了ET的MIC單機(jī)單卡和單機(jī)多卡異構(gòu)高性能集群解決方案,大幅降低了計(jì)算時(shí)間。實(shí)際測(cè)試數(shù)據(jù)顯示,單機(jī)單卡與串行程序相比性能提升25倍,單機(jī)多卡版本與串行程序相比性能提升74倍。
Q:本次疫情將對(duì)于HPC在病毒研究領(lǐng)域的應(yīng)用產(chǎn)生哪些影響
在抗疫的生死競(jìng)速的賽場(chǎng)上,也許我們算的快一點(diǎn),我們能救治的病人,能拯救的生命就會(huì)多一點(diǎn)。
從短期來看,科技戰(zhàn)疫正加速HPC在醫(yī)療領(lǐng)域的廣泛應(yīng)用,原來使用HPC最多的是科研院所,在疫情期間醫(yī)院、公共衛(wèi)生防預(yù)等機(jī)構(gòu)都開始使用HPC。
從長(zhǎng)期來看,疫情過后,會(huì)誕生各種新興的科學(xué)技術(shù)研究和檢測(cè),這些新興的科學(xué)研究對(duì)高性能計(jì)算有很高的需求,將促使HPC技術(shù)跨學(xué)科跨領(lǐng)域的融合。
從更大的范圍來看,疫情危機(jī)使中國(guó)以及全球的醫(yī)療信息化進(jìn)程加速,可以大膽的預(yù)測(cè),HPC將在全球病毒研究領(lǐng)域?qū)?huì)走向全面普及。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。