百度為何要做超級計(jì)算機(jī)Minwa?

百度投資47億建設(shè)的陽泉數(shù)據(jù)中心

《華爾街日報(bào)》5月12日報(bào)道,百度近日表示已在人工智能基準(zhǔn)測試中取得了全球最佳成績,其研發(fā)的超級計(jì)算機(jī)Minwa掃描了ImgaeNet數(shù)據(jù)庫里的100多萬張圖片,并能按照先前制定的標(biāo)準(zhǔn),自動(dòng)將其分為1000多種不同的類別,錯(cuò)誤率僅為4.58%,而人眼在ImageNet物體分類測試中的錯(cuò)誤率約為5%,微軟和谷歌分別為4.94%和4.8%。同時(shí)百度還透露正在通過超級計(jì)算機(jī),進(jìn)一步完善百度搜索引擎的中英語音識別系統(tǒng)。未來18個(gè)月,百度計(jì)劃研發(fā)出一個(gè)更強(qiáng)大的設(shè)備,能夠進(jìn)行每秒7千萬億次的計(jì)算。一旦成功,該設(shè)備將躋身全球十大超級計(jì)算機(jī)計(jì)算機(jī)之列。信息量比較大,我更關(guān)注的是,在云計(jì)算領(lǐng)域建樹頗豐的百度,進(jìn)軍超級計(jì)算機(jī)是否畫蛇添足?

超級計(jì)算機(jī)與云計(jì)算之爭

先看看什么是超級計(jì)算機(jī)。百度百科顯示,

超級計(jì)算機(jī)指能夠執(zhí)行一般個(gè)人電腦無法處理的大資料量與高速運(yùn)算的電腦,其基本組成組件與個(gè)人電腦的概念無太大差異,但規(guī)格與性能則強(qiáng)大許多,是一種超大型電子計(jì)算機(jī)。超級計(jì)算機(jī)是計(jì)算機(jī)中功能最強(qiáng)、運(yùn)算速度最快、存儲(chǔ)容量最大的一類計(jì)算機(jī),多用于國家高科技領(lǐng)域和尖端技術(shù)研究,是一個(gè)國家科研實(shí)力的體現(xiàn),它對國家安全,經(jīng)濟(jì)和社會(huì)發(fā)展具有舉足輕重的意義。是國家科技發(fā)展水平和綜合國力的重要標(biāo)志。

在沒有云計(jì)算之前,超級計(jì)算機(jī)代表著一個(gè)國家的科研實(shí)力,圍繞超算出現(xiàn)了跑分競賽,核心指標(biāo)是計(jì)算效率,即每秒的浮點(diǎn)運(yùn)算次數(shù)。中國超級計(jì)算機(jī)在2009年開始在國際上嶄露頭角,天河1號、天河1號A相繼穩(wěn)定世界TOP500榜,天河2號已連續(xù)三次奪得超級計(jì)算機(jī)TOP500競賽冠軍,并且在下一次競賽中依然穩(wěn)操勝券。在現(xiàn)在的超級計(jì)算機(jī)排行榜中,天河2號計(jì)算速度為33.86千萬億次/秒,第二名是位于美國能源部(DOE)橡樹嶺國家實(shí)驗(yàn)室中的Titan,17.59千萬億次/秒,與天河2號差距甚大,百度7千萬億次/秒的超級計(jì)算機(jī)面世,在這個(gè)榜單中只能屈居第六。

云計(jì)算出現(xiàn)之后,超級計(jì)算機(jī)的不少計(jì)算場景都被前者所瓜分。超級計(jì)算機(jī)單機(jī)運(yùn)算能力非常驚人,云計(jì)算方案則是基于多臺計(jì)算機(jī),基于Hadoop為代表的集群計(jì)算系統(tǒng)進(jìn)行并行計(jì)算,Hadoop負(fù)責(zé)計(jì)算任務(wù)分發(fā)調(diào)度歸總。兩個(gè)方案中真正負(fù)責(zé)計(jì)算的都是處理器,一般是CPU,百度已開始嘗試GPU。超級計(jì)算機(jī)將多個(gè)處理單元集中在一起減少任務(wù)劍通信延遲,云計(jì)算要跨越不同計(jì)算機(jī),乃至跨越不同機(jī)房進(jìn)行協(xié)同計(jì)算,存在任務(wù)間通信延遲。

超級計(jì)算機(jī)更適合密集型計(jì)算場景,比如武器研發(fā)、飛行模擬、氣候模擬、生育模擬和基因測序。不過從阿里云與華大基因、氣象局合作可以看出,就算是密集型計(jì)算云計(jì)算依然有用武之地。超級計(jì)算機(jī)如果能夠完成云計(jì)算的任務(wù)自然不應(yīng)該被替換,不過它有著幾個(gè)顯著的曲線:成本和能耗。天河二號總造價(jià)成本便高達(dá)18億元人民幣,在滿載情況下,天河二號每天耗費(fèi)是40萬人民幣,考慮到超級計(jì)算機(jī)通常負(fù)載率不會(huì)超過60%,通常耗費(fèi)還相應(yīng)降低。如果再加上軟件研發(fā)和升級、硬件維護(hù)和折舊、研發(fā)團(tuán)隊(duì)人力成本這些,年運(yùn)轉(zhuǎn)成本將十分可觀。因此,往往只有政府支持的實(shí)驗(yàn)室才肯投入超級計(jì)算機(jī)研究,實(shí)際上TOP10超級計(jì)算機(jī)幾乎都來自政府或高校背景實(shí)驗(yàn)室,只有少數(shù)是IBM這樣的企業(yè)參與。

百度為何做超級計(jì)算機(jī)Minwa?

網(wǎng)上曾經(jīng)出現(xiàn)過一篇《為跑分而生的超級計(jì)算機(jī)》,質(zhì)疑超級計(jì)算機(jī)的投入產(chǎn)出比太高,人們對我國是否應(yīng)該繼續(xù)投入超級計(jì)算機(jī)莫衷一是?,F(xiàn)在百度卻高調(diào)進(jìn)入這個(gè)領(lǐng)域,確實(shí)讓人覺得有些意料之外,畢竟百度在云計(jì)算上已經(jīng)投入巨大并且做得很好了。它在陽泉建立了亞洲最大數(shù)據(jù)中心,在GPU計(jì)算、綠色計(jì)算上都取得了領(lǐng)先。能夠證明其計(jì)算實(shí)力的還有兩點(diǎn),一個(gè)是百度大腦,這是一個(gè)人工智能引擎,李彥宏曾對外表示它已具備3歲小孩智力,底層驅(qū)動(dòng)正是百度云計(jì)算平臺;另一個(gè)是百度大數(shù)據(jù)引擎,這是全球首個(gè)開放式大數(shù)據(jù)引擎,百度已將它的大數(shù)據(jù)處理能力開放出來。

百度在大力投入云計(jì)算的同時(shí)投資超級計(jì)算機(jī),自然不是為了前面所說的“跑分”,進(jìn)入全球第7、很難做到第1,與天河2號競爭這不符合百度的風(fēng)格和利益。我認(rèn)為有以下幾個(gè)原因促使百度進(jìn)入超級計(jì)算機(jī):

1、科研的需要。超級計(jì)算機(jī)在商用上還缺乏有說服力的競爭力,不過在科研上它卻有著不可替代性,尤其是大規(guī)模、實(shí)時(shí)數(shù)據(jù)處理。百度在研發(fā)上投入力度前所未有,在中國同行中名列前茅,已連續(xù)6個(gè)季度增長率超過10%,其中很大部分放到了語音、圖像、大數(shù)據(jù)這些需要強(qiáng)大計(jì)算能力的技術(shù)上,有了超級計(jì)算機(jī)或許可以做得更好,正如開篇所提,百度在人工智能基準(zhǔn)測試取得全球最佳成績正是基于Minwa。這些技術(shù)最終目標(biāo)是要讓百度的產(chǎn)品尤其是移動(dòng)搜索,變得更加智能,而百度已立志成為一家人工智能公司。

2、技術(shù)的突破。人們在過去太過于關(guān)心超級計(jì)算機(jī)的運(yùn)算能力這樣的指標(biāo),對于它的能耗、成本卻鮮有關(guān)注,同時(shí)也一直沒有太大的突破。百度的超級計(jì)算機(jī)Minwa很可能是基于GPU計(jì)算,這比CPU更節(jié)能,且計(jì)算能力更強(qiáng)——只是對計(jì)算任務(wù)有所要求,它更適合圖像處理。百度此前已在陽泉數(shù)據(jù)中心采取GPU計(jì)算,百度首席科學(xué)家吳恩達(dá)(Andrew Ng)是人工智能領(lǐng)域的權(quán)威學(xué)者,他在一個(gè)實(shí)驗(yàn)后的結(jié)論是,三臺服務(wù)器共裝了12個(gè)GPU就可以達(dá)到12 萬億次/秒的運(yùn)算能力,遠(yuǎn)遠(yuǎn)超過谷歌1000節(jié)點(diǎn)CPU群的運(yùn)算能力。因此,百度下一代超級計(jì)算機(jī)很可能采取了GPU計(jì)算,進(jìn)而在能耗和成本上有所突破。英偉達(dá)早在2011年就表示將會(huì)使用自己的高端GPU和新的GPU+ARM芯片在西班牙制造一臺新的超級計(jì)算機(jī)。

3、超級云計(jì)算。將普通服務(wù)器組合成集群的云計(jì)算平臺可以與一臺超級計(jì)算機(jī)實(shí)力相當(dāng),倘若將超級計(jì)算機(jī)連接起來構(gòu)成集群,計(jì)算能力則會(huì)指數(shù)級增長。這看上去還有些癡人說夢,不過未來超級計(jì)算機(jī)組網(wǎng)進(jìn)行計(jì)算,形成超級計(jì)算機(jī)集群,超級云計(jì)算平臺應(yīng)該是必然結(jié)局。百度如果要大力發(fā)展云計(jì)算和大數(shù)據(jù)技術(shù),很可能會(huì)進(jìn)行這類方向上的嘗試,不過這得擁有自己的超級計(jì)算機(jī)。

4、客戶的需求。百度已推出大數(shù)據(jù)引擎旨在為第三方開發(fā)者尤其是大中型企業(yè)提供大數(shù)據(jù)處理服務(wù),同時(shí)百度還有PaaS形態(tài)的云計(jì)算平臺。它的一些潛在客戶,比如華大基因、中國氣象局、動(dòng)漫企業(yè)等等很可能有需要超級計(jì)算機(jī)才能完成的計(jì)算需求,百度擁有自己的超級計(jì)算機(jī)并將之與云計(jì)算平臺集成將可以滿足所有計(jì)算需求。天河1號在2011年將嘗試過通過云計(jì)算平臺將冗余計(jì)算能力開放出來做動(dòng)漫渲染。

最后,不得不用那句俗套的話來總結(jié)本文:意料之外,情理之中,這可以回答百度為何要做超級計(jì)算機(jī)這個(gè)問題。

微博@互聯(lián)網(wǎng)阿超 微信 羅超(luochaotmt)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2015-05-14
百度為何要做超級計(jì)算機(jī)Minwa?
百度投資47億建設(shè)的陽泉數(shù)據(jù)中心《華爾街日報(bào)》5月12日報(bào)道,百度近日表示已在人工智能基準(zhǔn)測試中取得了全球最佳成績,其研發(fā)的超級計(jì)算機(jī)M

長按掃碼 閱讀全文