文/穆楠(本文首發(fā)百度百家)
抽煙為社么增加肺部細(xì)胞變異率?用簡(jiǎn)單IT方式來(lái)講,是你生命程序那段代碼被黑客給黑了——黑客黑的概率會(huì)隨著環(huán)境因素不同而變化,如果經(jīng)常抽煙,如果經(jīng)常生活在不好的環(huán)境里,受到各種各樣病毒感染,你的"生命程序"就可能被黑。而一個(gè)腫瘤細(xì)胞發(fā)生到你最后你可以用CT掃描能查出來(lái),平均要15年。
這是22日在深圳IT領(lǐng)袖峰會(huì)上華大基因首席執(zhí)行官王俊的一段發(fā)言,在演講的過(guò)程中中,王俊摒棄了醫(yī)學(xué)專業(yè)名詞,試圖用IT人都能理解的“黑客”、“代碼”等詞來(lái)解釋為什么生命是“數(shù)字化”的,我們又該如何去理解生命、甚至防治疾病,他同時(shí)預(yù)測(cè),在2019年或許可以實(shí)現(xiàn)免費(fèi)測(cè)序個(gè)人的全部基因組,這或許對(duì)于每個(gè)人的健康有些重大意義。
下面根據(jù)王俊的實(shí)錄,總結(jié)了6與我們最為相關(guān)的話題,包括生命的編程、“源代碼”的異同、疾病的根源、利用數(shù)據(jù)挖掘能治療疾病等。(注:在原文的基礎(chǔ)上有所刪節(jié))。
1、生命能夠“被編程”?
當(dāng)我們講數(shù)字化的時(shí)候,講計(jì)算機(jī),講IT,習(xí)慣于以硅為體系。但是在講到生命的時(shí)候是以碳為體系。生命的基礎(chǔ)是碳,生命是數(shù)字化的。它能夠儲(chǔ)存嗎?能夠編程嗎?能夠用不同的程序改變來(lái)實(shí)現(xiàn)不同的生命形式嗎?可以做克隆嗎?
答案當(dāng)然是行的——我們是很容易做克隆的。它能存儲(chǔ)嗎?能,為什么能那么簡(jiǎn)單從一個(gè)羊身上提一個(gè)細(xì)胞變成另一個(gè)羊呢?因?yàn)槟莻€(gè)羊的細(xì)胞儲(chǔ)存了所有羊的生命程序。一個(gè)巴掌大的DNA可以儲(chǔ)存多少年呢?事實(shí)上可以達(dá)到上億年的儲(chǔ)存時(shí)間,最起碼可以上百萬(wàn)年。DNA是可以存儲(chǔ)的。
他能夠計(jì)算嗎?當(dāng)然能。因?yàn)橛?jì)算和編程最核心基本單位是基因,基因是生命體最基本構(gòu)成單位。我們每個(gè)人身上蘊(yùn)藏所有信息組合就是一套生命信息基本程序,這套基本程序就是生命的語(yǔ)言。
它的語(yǔ)言怎么形成的呢?在最開(kāi)始的時(shí)候,就像每個(gè)程序員寫(xiě)出一個(gè)功能模塊希望所有人都用他這個(gè)功能模塊一樣,在生命體里形成一些基因、一些蛋白質(zhì)、一些小分子,基因、蛋白質(zhì)、小分子也希望不斷擴(kuò)張自己,在不斷擴(kuò)張自己同時(shí),其實(shí)在美國(guó)有一本書(shū)非常出名,整個(gè)不斷過(guò)程就是不斷復(fù)制、不斷擴(kuò)張、不斷延展,有時(shí)候發(fā)現(xiàn)一個(gè)基因并不夠用,可以和其他基因一起合作,兩個(gè)基因、三個(gè)基因一起合作更好的時(shí)候,當(dāng)一堆基因合作更好的時(shí)候,就形成個(gè)體。
2、生命的“源代碼”為何不同?
我們?nèi)松砩嫌?-3萬(wàn)個(gè)基因,水稻有5萬(wàn)多基因,不同物種有不同基因,比如我們現(xiàn)在看到一個(gè)酵母菌用4000個(gè)基因,所有不同基因組合形式不同的生命程序,不同生命程序就形成你這個(gè)個(gè)體與周圍環(huán)境適應(yīng)。檢查這套程序到底好用不好用的唯一標(biāo)準(zhǔn)——
就是你這套程序能不能活下去?傳播更多后代。
當(dāng)你選擇傳播更多后代的這套程序就叫做可以適應(yīng)于這套環(huán)境的生命語(yǔ)言。所以我們看見(jiàn)所謂的達(dá)爾文進(jìn)化學(xué)說(shuō)、適者生存都是這個(gè)基礎(chǔ)上建立,我們每個(gè)人更基因信息的載體,每個(gè)人跟微小蟲(chóng)子相比都發(fā)現(xiàn)了相似性,很多基因從那兒傳到我們身上。對(duì)于個(gè)體來(lái)說(shuō)也是一樣的,每個(gè)人一套生命程序也是不一樣的。
舉例來(lái)說(shuō),為什么西藏人可以高山適應(yīng)?為什么我們上了高原有非常強(qiáng)的高原反應(yīng),是因?yàn)樯眢w一套程序沒(méi)有寫(xiě)進(jìn)高山適應(yīng)的基因,藏族人有一套基因,有這個(gè)基因的人群可以在高原體系上沒(méi)有反應(yīng),像我們?cè)谏厦婢筒恍小T跐h族人體系里就只有5%人有這個(gè)基因,而藏族人達(dá)到95%。這樣的東西不僅僅單純存在在西藏特別復(fù)雜極端的環(huán)境里,還有很多東西跟飲食相關(guān)。比如南方傣族人因?yàn)樵谧嫦冉?jīng)常吃檳榔,所以體內(nèi)基因很多跟檳榔適應(yīng)。等等。
為什么西藏人跟漢族人不一樣呢?當(dāng)我們考慮一個(gè)精子、卵子結(jié)合的時(shí)候,他發(fā)生了重組,每一代當(dāng)中,你孩子和父母之間有100個(gè)基因突變,這些基礎(chǔ)就形成不同生存策略,環(huán)境在時(shí)時(shí)刻刻變化、基因在時(shí)時(shí)刻刻變化,基因組是預(yù)測(cè)程序。你身上基因是因?yàn)槟阕嫦壬锨?、上萬(wàn)年不斷學(xué)習(xí)、進(jìn)化,對(duì)你后來(lái)有可能遇到的環(huán)境的預(yù)測(cè)。你體內(nèi)基因不會(huì)告訴你去不去高原,但是一定會(huì)告訴你去完高原會(huì)有什么反應(yīng)。
有人說(shuō),如果你做真正很好的遵循基因告訴你的事情,你可以活到150歲,但是為什么活不到150歲?因?yàn)槟銜?huì)得各種各樣的病,這些病從年輕的時(shí)候開(kāi)始一直到年老都有關(guān)系,而這些病跟基因有什么關(guān)系、或者跟環(huán)境、跟數(shù)字化、跟IT、BT有什么關(guān)系呢?
3、疾病就是基因出現(xiàn)了bug?
基因里面的毛病有點(diǎn)像寫(xiě)程序的時(shí)候出了一個(gè)bug,出了bug,基因程序運(yùn)行不了,在有時(shí)候就出現(xiàn)很嚴(yán)重的問(wèn)題。
比如各種各樣罕見(jiàn)疾病。有罕見(jiàn)疾病的一般生存周期都非常短,我們有各種各樣例子,這種罕見(jiàn)疾病聽(tīng)起來(lái)非常罕見(jiàn),但是加起來(lái)一點(diǎn)都不罕見(jiàn),中國(guó)有大于5.6%的孩子出生有各種各樣的出生缺陷。生命程序不斷試代碼、試代碼過(guò)程中不斷試錯(cuò),當(dāng)然每一個(gè)錯(cuò)誤并不是代表新的往前演化的可能。
當(dāng)孩子出身之前,我能不能做一些檢測(cè),早點(diǎn)發(fā)現(xiàn)有什么問(wèn)題?但需要先查一下你的父親、母親有沒(méi)有基因突變,如果有,你們生孩子概率有多少,如果這樣的話,以后就不要配八字了,談戀愛(ài)結(jié)婚之前先配一下基因,看生命基因程序是不是匹配。
懷孕兩到三個(gè)月之內(nèi)可以對(duì)孩子進(jìn)行完整基因檢測(cè),尤其是針對(duì)非常罕見(jiàn)的基因性疾病,通過(guò)這些篩差可以達(dá)到出生前防控。比如,中國(guó)耳聾發(fā)生率很多是因?yàn)殄e(cuò)用抗生素,如果體內(nèi)基因不能受鏈霉素這個(gè)抗生素,一下就耳聾。但如果早一點(diǎn)知道他得各種各樣的心臟病、耳聾,包括自閉癥風(fēng)險(xiǎn),我們是不是可以早一點(diǎn)干預(yù)?是可以的。我們能不能治呢?除了用一個(gè)非??勺兊男畔⒖催@些東西之后,我們又有一個(gè)非常瘋狂的想法——
4、利用數(shù)據(jù)挖掘能治療罕見(jiàn)???
能不能通過(guò)大數(shù)據(jù)挖掘發(fā)現(xiàn)一些罕見(jiàn)病真正解決方案呢?答案是可以的!
我們(華大基因)有一個(gè)計(jì)劃,搜索了100萬(wàn)人基因數(shù)據(jù),尋找那些單純從基因校對(duì)來(lái)講他應(yīng)該單基因疾病,但是非常健康的人,這些人我們叫超級(jí)英雄——他們體內(nèi)有非常明確的致病基因,但是非常健康,為什么?因?yàn)轶w內(nèi)有另外一套基因保護(hù)他。就像程序我一段出現(xiàn)bug,但是有另外一段修復(fù),就非常健康。如果找出那一段是什么,也許可以找出罕見(jiàn)性疾病的藥物。
再往下走是腫瘤,很多人面對(duì)腫瘤威脅,腫瘤是你生存過(guò)程中由于環(huán)境因素影響,你的基因程序在變異,所有細(xì)胞都來(lái)源于第一個(gè)細(xì)胞,受精卵細(xì)胞,從那個(gè)細(xì)胞開(kāi)始每次都會(huì)引發(fā)程序變化。不同環(huán)境影響會(huì)導(dǎo)致程序非常大不同——比如抽煙增加肺部細(xì)胞變異率。用簡(jiǎn)單IT方式來(lái)講,是你生命程序那段代碼被黑客給黑了。黑客黑的概率會(huì)隨著環(huán)境因素不同而變化,如果經(jīng)常抽煙,如果經(jīng)常生活在不好的環(huán)境里,或者受到各種各樣病毒感染,可能程序被黑。
怎么辦呢?其中有可能一個(gè)細(xì)胞發(fā)生被黑了,沒(méi)有關(guān)系,有人說(shuō)我身體有上億個(gè)細(xì)胞。但是如果一個(gè)細(xì)胞被黑了,他很有可能獲得比其他細(xì)胞更強(qiáng)的適應(yīng)性,他可以不斷擴(kuò)張。從一個(gè)腫瘤細(xì)胞發(fā)生到你最后你可以用CT掃描能查出來(lái),平均要15年。也就是15年內(nèi)體內(nèi)有腫瘤細(xì)胞你不知道,我們能不能早點(diǎn)發(fā)現(xiàn)他?答案是可以的,因?yàn)樗屑?xì)胞最終都要游離到血液里,我們通過(guò)非常深度的基因檢測(cè)可以看到你體內(nèi)有沒(méi)有腫瘤細(xì)胞。
5、如何用基因工程治療腫瘤?
如果得了腫瘤怎么辦呢?每一個(gè)人的腫瘤,每一個(gè)個(gè)體,腫瘤每一個(gè)細(xì)胞的基因都不一樣,你做的事是對(duì)所有細(xì)胞真正基因監(jiān)測(cè),而不是簡(jiǎn)單的手術(shù)一切、放療、化療,這樣的治療有可能在未來(lái)兩三年內(nèi)看到飛速發(fā)展。
其實(shí)萬(wàn)物都是跟基因有關(guān)系。我的體內(nèi)細(xì)胞如果以人為一個(gè)整體的話,作為人這個(gè)個(gè)體的細(xì)胞只占人體的細(xì)胞的1/10,還有9/10是各種各樣的微生物、各種各樣病毒,你天天洗兩次澡都沒(méi)有用。你吸收一個(gè)半小時(shí)候所有細(xì)菌都回來(lái)了。這些微生物并不是都是壞的,比如微生物體內(nèi)病源微生物會(huì)形成什么影響?所帶來(lái)影響是非常大的,比如埃博拉病毒、SARS病毒,90%發(fā)燒腹瀉你根本不知道怎么回事。小于1%微生物可以被培養(yǎng),你根本沒(méi)有辦法搞明白到底什么讓你發(fā)燒、什么讓你腹瀉,你可以所有DNA提取出來(lái),一個(gè)小時(shí)內(nèi)就知道到底怎么會(huì)感染。早一點(diǎn)這樣做,就可以早一點(diǎn)擺脫疾病風(fēng)險(xiǎn)。
還有另外一個(gè)事情,高血糖、高血壓三高,30年前中國(guó)糖尿病發(fā)生率0.67%,現(xiàn)在已經(jīng)接近11%,1/4中國(guó)成年人要么得糖尿病、要么要得糖尿病,不可能是基因在過(guò)去30年有非常大的改變,是因?yàn)轱嬍匙兓?、環(huán)境變化,引發(fā)腸道微生物菌群失調(diào),很多疾病都跟這個(gè)有關(guān)系。
我們應(yīng)該做的是確保你體內(nèi)是符合真正健康的菌群體系,最終我們要完成這個(gè)生命公式——右邊是你表現(xiàn)的狀況,身高、體重、各種各樣的病理特征、健康與否,中間的公式怎么寫(xiě)呢?相當(dāng)于我們只知道一個(gè)程式的輸入端、輸出端,中間是怎么編程,毫無(wú)所知。該怎么辦呢?
答案是大數(shù)據(jù),健康大數(shù)據(jù)取決于把所有輸入端、輸出端全部計(jì)算清楚,如果研究清楚身高基因的關(guān)系,需要100萬(wàn)人。要研究清楚絕大部分復(fù)雜疾病和基因以及環(huán)境的關(guān)系,需要100萬(wàn)人。你需要把100萬(wàn)人各種各樣信息全部搜集,才能得到生命公式。
6、2019年免費(fèi)測(cè)序個(gè)人完整基因組?
1999年華大基因參與了1%人類基因組計(jì)劃。當(dāng)時(shí)測(cè)序需要10億美金,最近已經(jīng)降成1萬(wàn)美金,仍然很貴,要搜集100萬(wàn)人的數(shù)據(jù)仍然很貴,現(xiàn)在可以做到1000美金,我估計(jì)明年會(huì)推出一個(gè)500美金可以測(cè)定一個(gè)人的完整基因。這就可以搜集基因數(shù)據(jù)。
什么時(shí)候可以免費(fèi)呢?免費(fèi)實(shí)施的到來(lái)事實(shí)上在于基因本身的數(shù)據(jù)價(jià)值遠(yuǎn)遠(yuǎn)大于產(chǎn)生他的數(shù)據(jù)所需要的成本。這樣一個(gè)趨勢(shì)延續(xù)我們認(rèn)為在2019年左右,5年左右時(shí)間我們可以真正達(dá)到這樣的結(jié)果。
為什么講基因組網(wǎng)絡(luò)那么重要,如果把每個(gè)人數(shù)據(jù)都連起來(lái),形成基因組網(wǎng)絡(luò),將是不可估量,每個(gè)人在上面產(chǎn)生數(shù)據(jù)和支持,基因組是一樣的。人因基因組計(jì)劃,每個(gè)人的基因計(jì)劃,當(dāng)所有基因組形成網(wǎng)絡(luò),當(dāng)所有病人組合了一個(gè)網(wǎng)站,我們就可能有機(jī)會(huì)把這個(gè)基因和病之間的關(guān)系搞清楚,在上面會(huì)形成各種各樣的機(jī)會(huì),這些機(jī)會(huì)、信息和知識(shí)是以前我們?cè)跊](méi)有做甚至一個(gè)個(gè)人基因組是不可想象的。
最終要做的是需要人工智能來(lái)學(xué)習(xí),因?yàn)檫@么大的量已經(jīng)不可能用一個(gè)單一模型來(lái)解決。而華大已經(jīng)在做很多事,這些事聽(tīng)起來(lái)像天方夜譚,我們做了3000株小米,在同一個(gè)地方測(cè)定各種各樣生長(zhǎng)條件,最后看出來(lái)他產(chǎn)量是多少、營(yíng)養(yǎng)成分怎么樣、各種各樣結(jié)果,我們給他進(jìn)行深度學(xué)習(xí)、人工智能方法,現(xiàn)在給定另外一駐小米,我有90%準(zhǔn)確性可以預(yù)測(cè)他長(zhǎng)的怎么樣。對(duì)健康有這樣的能力嗎?當(dāng)我們擁有100萬(wàn)人基因測(cè)序的時(shí)候,離這樣的能力很近。
奧巴馬提出一個(gè)精準(zhǔn)醫(yī)療計(jì)劃,就是要做100萬(wàn)人基因組庫(kù),當(dāng)所有人完成后,我們會(huì)有一個(gè)水晶球,預(yù)測(cè)對(duì)你未來(lái)健康走向預(yù)知,而這樣的預(yù)知很有可能再做一些改變,我們聽(tīng)過(guò)3D打印、細(xì)胞存儲(chǔ)、基因編輯、我們聽(tīng)過(guò)合成生物學(xué),喝的啤酒的酵母將不是自然界酵母,而是計(jì)算機(jī)寫(xiě)出來(lái)的,酵母產(chǎn)生的啤酒味道也許比你現(xiàn)在喝的任何啤酒味道都要好。還有,生命信息的存儲(chǔ),我們都叫干細(xì)胞,就是年輕時(shí)候的生命信息,你不是想年輕嗎?在你年老的時(shí)候能不能把年輕時(shí)候的信息再回到,也許就年輕了。所有像科學(xué)幻想的東西都在生命科學(xué)界在以飛速方式往前走。
如果真正基于一個(gè)所謂人工智能方式、大數(shù)據(jù)處理方式,能管理健康、掌握預(yù)測(cè)的程序和健康關(guān)系,也許是真正最有意義的。
有關(guān)華大基因:華大是全球最大的基因組中心、最大的生物信息中心,其機(jī)構(gòu)遍布60多個(gè)國(guó)家,同時(shí)是國(guó)家基因庫(kù)承辦單位,國(guó)家基因庫(kù)存儲(chǔ)各樣生命信息體。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 迪卡儂的價(jià)格、lululemon的品質(zhì),平替正成為年輕消費(fèi)者的心頭好
- 三場(chǎng)與AI有關(guān)的死亡
- 100億美元史上最大融資的背后,國(guó)內(nèi)外巨頭齊瞄準(zhǔn)Data+AI
- 有一種羨慕叫“別人家的年終獎(jiǎng)”:京東采銷平均23薪,全網(wǎng)熱議“人的價(jià)值”
- 行業(yè)首個(gè)“人機(jī)大戰(zhàn)”對(duì)壘!AI翻譯已媲美人工
- 蘋(píng)果開(kāi)啟年終大促,降價(jià)1200元,被國(guó)產(chǎn)手機(jī)嚇怕了?
- 1999 元起,OPPO A5 Pro 超防水、超抗摔、超耐用
- 長(zhǎng)三角,如何把數(shù)據(jù)要素變成新長(zhǎng)江?
- 大模型,在內(nèi)卷中尋找出口
- 比亞迪“天神之眼”重磅升級(jí):無(wú)圖城市領(lǐng)航功能全國(guó)開(kāi)通
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。