華為存儲成人禮:我們的征途似星辰大海

原標題:華為存儲成人禮:我們的征途似星辰大海

導(dǎo)語:今年是華為存儲業(yè)務(wù)第十八年,這十八年來風雨兼程,從篳路藍縷到星辰大海,華為存儲見證了中國存儲產(chǎn)業(yè)從無到有、從弱到強的發(fā)展全過程。

本文詳細回憶了華為存儲十八年走過的風雨歷程:艱難曲折的成長過程、平凡可敬的奮斗者、扭轉(zhuǎn)乾坤的重要時刻、激動人心的產(chǎn)品技術(shù)……

由于篇幅較長,特劃分為十個小節(jié),采用連載的形式發(fā)布,具體章節(jié)如下:

  1. 第一場自我證明
  2. 一道決定終生的選擇題
  3. 獨自闖蕩江湖的少年
  4. 學(xué)會敬畏數(shù)據(jù)
  5. 回歸是為了更好地出發(fā)
  6. “有一個重要的任務(wù)交給你們”
  7. 用戶永遠都是最好的老師
  8. 簡而不減的秘訣
  9. 一抹丹青色,最是匠人心
  10. 未來征途似星辰大海

下面讓我們正式重溫華為存儲這段絲路藍縷、以啟山林的奮斗歷程。

這是一個頗為勵志的成長故事。從三五個人的小團隊,到如今幾千人的團隊規(guī)模;從一臺預(yù)研機產(chǎn)品,到如今全面布局的存儲產(chǎn)品線;從起步階段多年的凈投入,到如今連續(xù)八個季度全球全閃存增速第一;從過去的默默無聞,到如今Gartner魔力四象限領(lǐng)導(dǎo)者的??汀?/p>

做到這些,華為存儲花了十八年。

十八年風雨歷程,華為存儲從蹣跚學(xué)步的孩童,摸著河岸的石頭艱難前行,到仗劍走天涯、勇闖天下的少年,一路艱辛卻也收獲滿滿。今年是華為存儲十八年,猶如一場成人禮,它既是致敬自己過去奮斗的青春,也意味著未來要肩負起更大的責任。

現(xiàn)在讓我們重溫歷史,感受存儲產(chǎn)業(yè)奮斗者的溫度。

第一場自我證明

在科技領(lǐng)域,任何業(yè)務(wù)從0到1的過程都注定是艱難無比的,華為存儲也不例外。

華為進入到存儲領(lǐng)域純屬偶然,2001年互聯(lián)網(wǎng)科技泡沫破裂之后,幾乎波及到所有科技公司,華為亦不能幸免。

置之死地而后生,華為當時認為只做通信產(chǎn)品未來會面臨很大的風險,需要積極尋找新的產(chǎn)業(yè)機會點。于是,華為商業(yè)網(wǎng)絡(luò)部悄然成立,存儲恰恰是其中一個新業(yè)務(wù)?!爱敃r有幾十個新業(yè)務(wù),存儲是到現(xiàn)在依然活著的三個業(yè)務(wù)之一?!比A為存儲資深專家張國彬如是說。

張國彬2002年清華畢業(yè)后進入華為,恰好分配到存儲研發(fā)團隊,從此開啟了與存儲近二十年的緣分,見證了華為存儲從無到有,從追趕到逐步超越的全過程。

“公司是2002年正式對存儲業(yè)務(wù)進行投入的。當時,存儲產(chǎn)業(yè)的確是一個潛力無比巨大的朝陽產(chǎn)業(yè)。不過,公司剛開始比較謹慎,當時團隊加起來也就十來個人”,張國彬回憶道,“華為存儲團隊首先需要證明有沒有能力把存儲這件事情干成?!?/p>

彼時的全球存儲產(chǎn)業(yè)正處于高速發(fā)展的階段,北美互聯(lián)網(wǎng)四騎士之一的存儲公司EMC因為在911事件中幫助摩根斯坦利24小時恢復(fù)全部業(yè)務(wù)而名聲大噪,全球存儲工業(yè)也正式開啟黃金時代。EMC在隨后短短幾年之內(nèi)完成了對Data General、Legato、Documentum、Avamar、VMware等一系列的收購,迅速完成了從高端存儲廠商到存儲巨頭的角色轉(zhuǎn)換,并開啟了長達十五年的存儲霸主生涯。

不過,誰能想到此時處于襁褓之中的華為存儲,會在十余年之后的中國市場實現(xiàn)對EMC的超越。

沒人、沒槍,但是又必須在一年之內(nèi)把預(yù)研的產(chǎn)品研發(fā)出來,這就是華為存儲團隊當時所面臨的困難局面。為此,華為存儲率先想到的思路是與高校科研機構(gòu)合作。于是,華為存儲與華中理工大學(xué)(之后改名為華中科技大學(xué))謝長生教授團隊進行合作,開始基于標準服務(wù)器+商用FC卡+開源RAID代碼+Cache/SCSI組件打造預(yù)研的存儲系統(tǒng)。

“經(jīng)過一年的努力,存儲原型機終于研發(fā)成功,將FC環(huán)境的I/O跑通?!睆垏蚪榻B,“后來通過了管理層的驗收,華為存儲在2003年也順理成章地正式啟動研發(fā)?!?/p>

借助開源+創(chuàng)新的力量,華為存儲第一次證明了自己有能力活下去。不過,接下來還有更多意想不到的困難等待著華為。

一道決定終生的選擇題

在這個世界上,成功從來沒有捷徑可走,因為世上本來就沒有捷徑,科技領(lǐng)域尤甚。

正式開啟研發(fā)的華為存儲,馬上面臨著一道選擇題:走開源路線還是走創(chuàng)新路線從頭開始。

為此,華為存儲團隊內(nèi)部發(fā)生了激烈的討論。采用開源路線,意味著可以加速產(chǎn)品研發(fā)成功的速度,這對于初涉存儲領(lǐng)域的華為而言,不失為一條“捷徑”,但開源也普遍存在著代碼與功能相對簡單、效率較低、Bug較多等情況;而從一開始就走創(chuàng)新路線的話,意味著需要保持持續(xù)投入,對時間和成本上是一場考驗。

“從長遠來看,選擇開源在未來會帶來更多風險?!睆垏蚪忉尩?,“經(jīng)過充分論證和權(quán)衡,團隊最后一致決定寧愿花費數(shù)年時間,也要為客戶、自己奠定堅實的基礎(chǔ)?!边@個決定對華為存儲后來的研發(fā)體系打造、平臺級研發(fā)策略有著決定性的影響,也是華為存儲后續(xù)能夠?qū)崿F(xiàn)持續(xù)突破的關(guān)鍵。

不過一年下來,研發(fā)團隊發(fā)現(xiàn)這條路遠沒想象中那么容易,頗有“一入存儲深似?!钡母杏X。

“干了一年發(fā)現(xiàn)不對勁,存儲對于研發(fā)投入實在太大了?!睆垏蛉缡钦f,“當時光企業(yè)級硬盤的價格就非常昂貴,加上人力成本也較高?!睂嶋H上,企業(yè)級存儲的技術(shù)門檻極高,作為企業(yè)數(shù)據(jù)的最后歸屬地,企業(yè)級存儲產(chǎn)品對于可靠性以及數(shù)據(jù)一致性有著極高的要求,這也直接決定了存儲研發(fā)需要高投入。

面臨著如此高昂的成本,華為也開始有一些猶豫。到底還要不要堅持投入?如果堅持下去,還需要持續(xù)高投入多久才能做出有市場競爭力的產(chǎn)品?做出產(chǎn)品之后,留給華為的市場窗口還有多大?

2004年,華為認為咬緊牙關(guān)也要上,但是需要靈活的方法去更加快速地了解市場變化和用戶需求,進而加速存儲產(chǎn)品的研發(fā)。為此,華為決定開始采用跟國外領(lǐng)先存儲廠商合作的方式,一方面滿足了內(nèi)部業(yè)務(wù)需求,另外則可以通過成熟產(chǎn)品了解到用戶的實際需求。

之后,操作系統(tǒng)內(nèi)存管理、消息通信、各種存儲協(xié)議、Cache、RAID軟件、集群管理、配置運維……團隊們把一個個功能都給實現(xiàn)了。在完成單控制器產(chǎn)品之后,華為存儲研發(fā)團隊又開始著手實現(xiàn)雙控存儲系統(tǒng)的研發(fā)。

在當時,從單控制器存儲到雙控制器存儲意味著研發(fā)能力有著本質(zhì)的飛躍,對于存儲架構(gòu)設(shè)計、軟件研發(fā)等都有著極高的要求。單控制器存儲一旦控制器出現(xiàn)某個問題,將會導(dǎo)致整個存儲的故障,這無疑會給用戶業(yè)務(wù)帶來致命的影響;而雙控制器則相當于給存儲買了一份保險,一個控制器出現(xiàn)故障,另一個控制器立馬跟上,確??蛻魳I(yè)務(wù)不會出現(xiàn)中斷。

到了2005年,華為花費三年多時間基本完成了對于雙控存儲系統(tǒng)的研發(fā)工作,這也意味著華為存儲研發(fā)實現(xiàn)了階段性的勝利。

就在此時,一次良機又出現(xiàn)在華為存儲面前,它有膽量去接受它么?

獨自闖蕩江湖的少年

2006年,華為正式上市了F800存儲。此時,華為開始考慮大規(guī)模進入到存儲產(chǎn)業(yè)之中。這時,華為又面臨著選擇:第一是自己完全做,無論是研發(fā)、市場、渠道、服務(wù)都是自己來;第二是選擇與合作伙伴一起。

這一次,華為選擇了后者。

2005年,存儲與安全巨頭賽門鐵克拋來橄欖枝,華為與賽門鐵克有了第一次接觸。經(jīng)過不斷的接觸與談判,華為與賽門鐵克在2006年正式開始運作合資公司--華為賽門鐵克(以下簡稱:華賽):華為出人和研發(fā),賽門鐵克出資,主攻存儲與安全業(yè)務(wù)。

采用獨立合資公司的方式在當時對雙方都有最大利益,華為獲得了充足的資金,可以持續(xù)加大對存儲研發(fā)的投入,打造出更具市場競爭力的產(chǎn)品;賽門鐵克則規(guī)避了自己從頭開始干的風險。

經(jīng)過近兩年的籌備,華賽公司在2008年正式對外掛牌成立,存儲團隊規(guī)模達到了200人左右。華為存儲此時猶如一個獨自闖蕩江湖的少年,懷揣遠大夢想,卻也心存忐忑。

2008年是存儲產(chǎn)業(yè)標志性的一年,存儲市場孕育著巨大變革,高端存儲創(chuàng)新架構(gòu)、重復(fù)數(shù)據(jù)刪除與壓縮技術(shù)、閃存技術(shù)、集群文件技術(shù)……幾乎所有存儲細分領(lǐng)域都涌現(xiàn)出一大批具有創(chuàng)新精神的創(chuàng)業(yè)公司,存儲產(chǎn)業(yè)的創(chuàng)新可謂是百花齊放。

“合資公司給了華為存儲獨立成長的機會。”張國彬如是說。

華賽猶如一個奔跑的少年,脫離了華為體系,運轉(zhuǎn)效率、決策效率就像創(chuàng)業(yè)公司那樣迅速,積極參與到存儲的創(chuàng)新之中。2009年華賽就開發(fā)出了第一款SSD,要知道SSD在高端存儲中首次采用也僅僅是在2008年。

不僅如此,華賽作為一家獨立的合資公司,開始走出去、引進來,在全球范圍招募了大量優(yōu)秀人才,從而奠定了華為存儲全球研發(fā)體系的基礎(chǔ)。通過不斷見世面和引進存儲大咖,華為存儲整體人才體系的視野和思路得到了大幅開拓。

“賽門鐵克并沒有為華賽注入一行代碼。華賽沒有采用賽門鐵克任何技術(shù),但是研發(fā)團隊與賽門鐵克存儲專家們交流的確是受益匪淺?!睆垏虺吻宓?。

不僅僅在研發(fā)體系、研發(fā)思路上突飛猛進,獨立運作的華賽意味著沒有大公司的市場和銷售資源可用,必須自己建立專業(yè)的銷售與市場團隊,勇敢走出去見客戶、啃單子。張國彬回憶道,那幾年的獨立運營,的確給了銷售與市場團隊很大鍛煉,政府、金融、運營商、大企業(yè)的頭部客戶都要挨個啃下來?!?009年,華賽存儲產(chǎn)品就用在了國有大銀行的票據(jù)影像歸檔上,并且在各個行業(yè)都開始取得突破?!?/p>

然而,成長的道路從來沒有一帆風順。人們常說,成長其實就是一種刻骨銘心的蛻變。華賽這位奔跑的存儲少年,一樣也有摔得刻骨銘心的時刻。

學(xué)會敬畏數(shù)據(jù)

2009年,隨著華賽產(chǎn)品在多個行業(yè)用戶中得到使用,一些問題也開始接踵而至:告警器聲音與旋轉(zhuǎn)磁盤聲音形成共振,造成硬盤批量次故障;空氣污染、環(huán)境中的硫化物腐蝕硬盤,造成硬盤變慢;控制器短路;甚至傳說中宇宙射線引起內(nèi)存Bit位翻轉(zhuǎn)導(dǎo)致數(shù)據(jù)不一致的情況也出現(xiàn)了。

這讓華賽公司開始重新審視存儲。張國彬表示:“老實說,這些問題讓華為存儲真正學(xué)會了尊敬存儲、敬畏數(shù)據(jù)?!边@個世界上從來沒有隨隨便便的成功,市場上的競爭友商之所以能夠在市場中占據(jù)領(lǐng)先,跟它們多年以來摸爬滾打分不開,此時的華為存儲還稍顯稚嫩,面對這些問題顯得有點措手不及。

從摔倒的地方重新開始,華賽公司痛定思痛,在時任華賽存儲業(yè)務(wù)總裁范瑞琦的帶領(lǐng)下,研發(fā)團隊在2009年干了一件事情,除了手頭上的研發(fā)工作之外,將底層所有存儲協(xié)議、硬件部件要搞得清清楚楚、明明白白。

之后,研發(fā)團隊硬是把厚厚的英文協(xié)議書全部啃了下來,然后重新進行抗振、防腐設(shè)計,并且與硬盤廠商進行聯(lián)合設(shè)計,認真摸索每種、每塊硬盤故障參數(shù),并且進行軟硬件聯(lián)合處理,硬盤百萬行代碼的固件(Firmware)必須經(jīng)過長時間的實驗室驗證才能給用戶升級。

自此,華為存儲確定了堅不可動的原則:存儲可靠性第一,數(shù)據(jù)絕對不能丟失,存儲產(chǎn)品只有做到數(shù)據(jù)不丟失才能上市。

“直到今天我依然清晰的記得,每個周末大家聚在一起做問題根因分析的日子,針對每個出現(xiàn)的問題大家刨根問底,直到最終把它解決?!睆垏蚧貞浀?。

另外讓華賽這位存儲少年受益匪淺的就是與世界一流人才的交流與學(xué)習(xí)。當時的華賽研發(fā)團隊,很多人都畢業(yè)于名校,并且已經(jīng)在存儲領(lǐng)域積累了好幾年的經(jīng)驗,對自己可謂是信心滿滿。但是世界一流人才的到來,向華為注入的不僅僅是存儲領(lǐng)域各種領(lǐng)先的經(jīng)驗、技巧和方法,更是在思想層面對于華賽存儲研發(fā)團隊產(chǎn)生重要的影響。

比如,在存儲領(lǐng)域非常常見的時延控制方面,時延可謂是存儲領(lǐng)域一個關(guān)鍵指標,時延的波動與異??赡軙o存儲系統(tǒng)的性能帶來極大影響,進而會直接影響到業(yè)務(wù)的性能。如何對于時延進行精準的控制可謂是一門手藝活,一流存儲的大咖對于時延精準控制的專注猶如匠心精神,讓華賽研發(fā)團隊醍醐灌頂,明白了存儲技術(shù)的打磨沒有止境,需要有匠心精神對技術(shù)精益求精。

在這幾年的獨立運營中,華賽存儲摔了很多跤、吃了很多苦,也獲得了很多回報,整個公司運營狀況良好,連續(xù)兩次實現(xiàn)盈利;人才隊伍建設(shè)卓有成效,研發(fā)體系打造初步成型;產(chǎn)品研發(fā)上節(jié)節(jié)開花,第二代中端系統(tǒng)、SSD硬盤等新品讓業(yè)界為之一亮。

就在這時,華賽卻選擇了回歸華為大家庭,這個選擇會對存儲已經(jīng)構(gòu)建起來的產(chǎn)品、研發(fā)、銷售體系產(chǎn)生什么樣的影響?

回歸是為了更好地出發(fā)

2011年11月4日,華為和賽門鐵克宣布,雙方已就華為以5.3億美元收購賽門鐵克持有的華為賽門鐵克公司49%的股權(quán)達成協(xié)議。自此,華賽回歸成為定局。

如果按照5.3億美元的價格來計劃,華賽公司當年的估值已經(jīng)突破了10億美金,可謂是名副其實的存儲獨角獸。華賽公司也用自己親身經(jīng)歷證明了一個事實:這批華為存儲人是有能力在市場中生存乃至干出一番事業(yè)。

此刻的回歸,是會重蹈過去創(chuàng)業(yè)公司被并購入大公司之后碌碌無為的覆轍,還是會讓整個存儲業(yè)務(wù)如虎添翼、再上一個新臺階?這不僅是外界的疑慮,也是存儲團隊熱切期盼知道的。

“正式回歸之后,公司馬上大力投入存儲,明顯感覺到公司希望做大、做強存儲業(yè)務(wù)?!币晃唤?jīng)歷過華為存儲離開、獨立、回歸全過程的員工感嘆道,“如果依然保持獨立,出于營收、盈利等方面的考慮,研發(fā)上不可能完全放開手腳,尤其是在基礎(chǔ)技術(shù)領(lǐng)域的研發(fā)上?!?/p>

自此,華為存儲在研發(fā)體系和研發(fā)人才上正式步入了全球化、頂尖水平的建設(shè)階段,為日后的OceanStor存儲Dorado系列全閃存,Pacific系列海量存儲等重磅產(chǎn)品打下了堅實的基礎(chǔ)。

從國內(nèi)來看,在成都、北京、深圳三地,華為存儲早已建立起完善和強大的研發(fā)中心。全球也建立了多所存儲領(lǐng)域的研究所。經(jīng)過幾年的打造,華為存儲的研發(fā)團隊已經(jīng)媲美世界任何頂尖存儲公司。

研發(fā)在回歸之后另外一個最大的變化就是:平臺化。隨著全球研發(fā)體系的逐步建立與完善,華為存儲研發(fā)平臺化開始踏上了日程。張國彬透露:“以前在華賽時期,公司其實非常希望研發(fā)平臺化。但是華賽畢竟在規(guī)模上還較小,平臺化需要較長時間才會發(fā)揮作用?!钡牵貧w華為之后,華為存儲研發(fā)平臺戰(zhàn)略所需要的條件非常完善,華為存儲抽調(diào)了大部分研發(fā)力量來對平臺化進行建設(shè)。

華為數(shù)據(jù)存儲產(chǎn)品部部長項飛介紹:“存儲平臺化其實是一個漸進的過程,需要存儲關(guān)鍵技術(shù)能力、軟硬件研發(fā)能力、項目管理能力的不斷積累,然后通過一個組件化的思路,讓復(fù)雜的存儲系統(tǒng)由各種組件來構(gòu)成,不同的存儲系統(tǒng)之間的組件構(gòu)成也會有很大變化?!?/p>

毫無疑問,平臺化戰(zhàn)略就是先讓各項技術(shù)、功能逐步完成組件化,并且基于解耦的思路去構(gòu)建存儲系統(tǒng),最大限度的去復(fù)用各種技術(shù)與組件。這種平臺化戰(zhàn)略帶來最直接的好處就是:研發(fā)效率大幅提升,組件之間互融互通、產(chǎn)品更新迭代更加快速,可以更加快速地響應(yīng)市場上靈活多變的需求。

華為存儲這種自成立第一天就基于平臺化戰(zhàn)略,與通過各種并購而來的平臺有著天壤之別,雖然需要長時間的積累,但是隨著時間推移,研發(fā)布局與分工逐步完善,核心關(guān)鍵技術(shù)的不斷積累與沉淀,省去了日后各種產(chǎn)品與功能打通、兼容甚至未來規(guī)劃的種種麻煩,其所帶來的飛輪效應(yīng)也會日漸突出。

還有一個顯著改變就是,華為整個研發(fā)大體系中的研發(fā)成果能為存儲所用,比如華為2012實驗室研發(fā)成果、操作系統(tǒng)技術(shù)等等。項飛直言,存儲是一種極為復(fù)雜的產(chǎn)品,涉及到計算、網(wǎng)絡(luò)、介質(zhì)等多個領(lǐng)域,考慮到數(shù)據(jù)中心未來的發(fā)展趨勢,僅僅站在存儲研發(fā)團隊自身的視角是遠遠不夠的,需要充分利用華為內(nèi)部不同的研發(fā)團隊,進行協(xié)作,以更加寬廣的視角和開發(fā)合作的方式來推動存儲不斷向前發(fā)展。

自此,華為存儲的技術(shù)創(chuàng)新+用戶需求的雙輪創(chuàng)新機制開始真正發(fā)揮威力。日后,華為存儲產(chǎn)品一次次的在各種測試中刷屏霸榜,產(chǎn)品開創(chuàng)性創(chuàng)新也猶如芝麻開花節(jié)節(jié)高,這與其他相對“沉寂”的競爭對手形成了鮮明對比。

不過建立平臺化是一個痛苦和長期的過程。在這之前,華為存儲還遇到了更加富有挑戰(zhàn)的事情:如何讓自身產(chǎn)品線豐富和強大起來,在高端存儲和分布式文件存儲這兩大領(lǐng)域?qū)崿F(xiàn)突破。

高端存儲這座山必須躍過

在存儲產(chǎn)業(yè)中,高端存儲猶如皇冠上的那顆明珠,它直接代表著一家存儲廠商在業(yè)界的地位。如果說不想當將軍的士兵不是好士兵,那么不想做高端存儲的廠商一定不是有遠大抱負的廠商。這也是為什么華為會孜孜不倦投入到高端存儲的研發(fā)之中。

眾所周知,高端存儲所擁有的高可靠、高性能、高一致性使得其技術(shù)門檻極高,從1990年以來,在高端存儲市場真正擁有絕對實力只有EMC和HDS(后來更名為Hitachi Vantara)兩家公司,要想突破市場競爭壁壘談何容易。

“當時做決定還是非常艱難的,大家爭議與討論很多?!睆垏蛉缡钦f,“畢竟一旦決定了,投入成本會非常巨大,也不允許失敗?!笔聦嵣?,華為存儲要想進一步突破市場,攻克高端存儲也是必經(jīng)之路,“沒有高端存儲產(chǎn)品,中低端產(chǎn)品從長期來看也可能會賣不好。”

當時,云計算的趨勢剛開始冒起,一些存儲廠商已經(jīng)看到了高端存儲的弊病,雖然能夠完美滿足傳統(tǒng)業(yè)務(wù)場景的需求,但擴展性弱、投入大的弊病開始在云計算時代中逐步放大。張國彬透露:“當時的確有好幾家廠商看到了傳統(tǒng)高端存儲的弊病,大家都看到了未來的方向。”

為此,華為基于自身的技術(shù)基礎(chǔ),以及業(yè)界的趨勢,開始著手投入到高端存儲的研發(fā)之中。當時,張國彬帶領(lǐng)100來號人在山里封閉了幾個月,專攻華為高端存儲的新架構(gòu)設(shè)計。整個過程就像修煉絕世武功一樣,日復(fù)一日的用功無法感知到武功的精進程度,當打通任督二脈,捅破那層窗戶紙,猶如撥云見日、豁然開朗。

經(jīng)過不斷的摸索和努力,華為存儲終于在2013年正式推出了基于SmartMatrix架構(gòu)的第一代高端存儲產(chǎn)品。這是中國存儲廠商首次推出高端存儲產(chǎn)品,其意義和價值非凡。

它給華為存儲人注入了巨大的信心,也驅(qū)動著華為人主動去思考未來存儲的變革,為日后Dorado系列高端全閃存等一系列開創(chuàng)性的創(chuàng)新奠定了堅實基礎(chǔ)。其次,它為華為存儲打開各個行業(yè)頭部客戶提供了產(chǎn)品利器,大大提升了華為存儲的市場拓展深度和廣度。

“有一個重要的任務(wù)交給你們”

“項飛,有個重要的任務(wù)交給你們!帶領(lǐng)團隊把分布式文件存儲搞出來?!?/p>

接到領(lǐng)導(dǎo)的通知之后,項飛心中不禁有點忐忑,一直干通信軟件研發(fā)的他,這次要半路出家去搞存儲啦。

此時的華為存儲剛剛回歸,產(chǎn)品線主要還是以SAN存儲為主,之前華賽期間主要銷售賽門鐵克的文件存儲產(chǎn)品。如今回歸,要做大做強存儲業(yè)務(wù),屬于華為自己的分布式文件存儲產(chǎn)品必不可少。但在當時,研發(fā)分布式文件存儲產(chǎn)品的確是一項重大考驗,以致于華為內(nèi)部也有部分聲音認為很難研發(fā)來。

畢竟,在分布式文件存儲領(lǐng)域,IBM、NetApp、EMC(收購分布式存儲明星公司Isilon)這些大公司無論是產(chǎn)品技術(shù),還是市場銷售,都是當之無愧的翹楚。要想撬動分布式文件存儲的蛋糕,華為需要付出比常人更多的努力才行。

“在華為就是什么事情都敢去試一試。不懂分布式存儲沒關(guān)系,我就當它是‘二次創(chuàng)業(yè)’,努力學(xué)習(xí)和堅持就是了!”項飛最終橫下心去攻克分布式存儲這道難關(guān)。

于是接下來,項飛開始忙著招人、調(diào)整研發(fā)團隊結(jié)構(gòu)。“最難的是人,我花了很多時間去面試全球各種人才,找到合適的骨干人才,才能帶領(lǐng)團隊不斷前進?!表楋w如是說,“整個團隊很多人讓我很感動,像設(shè)計部很多人都是搞電信軟件的專家,他們?nèi)即蛏⒌礁鱾€新團隊之中,這次大家又重新開始,全部回到編碼崗位,基本都是邊學(xué)邊干把分布式文件系統(tǒng)研發(fā)出來的。”

做出分布式文件存儲不算很難,但做出有市場競爭力的分布式文件存儲卻不是件容易的事情。因為市場上的標桿已經(jīng)足夠高,像Isilon的全分布式對稱橫向擴展架構(gòu),元數(shù)據(jù)和數(shù)據(jù)均是分布在所有節(jié)點上,擁有極大的技術(shù)難度。華為的分布式存儲也采用的是全分布式對稱橫向擴展架構(gòu),那它的成色到底如何呢?

全對稱分布式架構(gòu)非常具有挑戰(zhàn)性,因為元數(shù)據(jù)全部動態(tài)分布式所有節(jié)點上,需要保證各種情況下元數(shù)據(jù)可用。在華為分布式存儲的研發(fā)過程中,最大的難點也就是跟元數(shù)據(jù)相關(guān)的問題,“當時團隊專家不分日夜排查出各種問題,保證了產(chǎn)品能夠順利推出?!?/p>

到了2014年,經(jīng)過兩年多努力,華為正式推出了采用全對稱分布式架構(gòu)的分布式文件存儲OceanStor 9000,成為業(yè)內(nèi)為數(shù)不多能夠采用此架構(gòu)的存儲公司。并且,OceanStor 9000無論是性能、擴展能力、穩(wěn)定低時延、自動分層能力都豎立了業(yè)界的新標桿。

華為OceanStor 9000

接下來幾年中,華為OceanStor 9000就開始了它在市場中的精彩表演。先是在國內(nèi)市場,OceanStor 9000大舉進入到媒資、科研、石油能源勘探等領(lǐng)域,憑借出色的產(chǎn)品力捕獲了一大批客戶。不僅如此,OceanStor 9000還在海外市場展現(xiàn)出非凡的戰(zhàn)斗力,在亞太、歐洲、中東等地區(qū)市場迅速獲得認可。

一時間,存儲老大EMC發(fā)現(xiàn)Isilon出現(xiàn)了一個最為強勁的對手。以至于EMC后來在官網(wǎng)專門發(fā)布了一段視頻“懟”了一把OceanStor 9000,這恐怕是中國存儲廠商第一次享受到存儲巨頭的高“待遇”。

用戶永遠是最好的老師

用戶永遠是最好的老師,因為它能夠最直白地讓你洞悉出業(yè)務(wù)真實應(yīng)用需求、自身的差距甚至競爭對手的優(yōu)缺點。

2014年,張國彬遠赴歐洲,成為華為存儲市場一線中的一員,每天穿梭于各種展會、演講之中。聽說德國一家知名的電信公司正在招標,需要采購一批存儲產(chǎn)品。張國彬決定和同事一起去接觸和拜訪該公司的架構(gòu)師,爭取把這家大客戶一舉拿下。

見面之后,該公司架構(gòu)師非常實在,還沒等張國彬口若懸河介紹華為存儲產(chǎn)品各種優(yōu)勢,拿出一份標書表格,要求華為存儲將產(chǎn)品性能能夠達到多少、各種工具生態(tài)對接情況、可靠性情況等一一列舉出來,“第一次遇見如此嚴謹和專業(yè)的用戶,一下明白了我們離用戶的差距還有點遠,需要改進的地方還非常之多。”

2017年華為正式推出了OceanStor存儲Dorado系列 V3產(chǎn)品。此刻的張國彬再見到這家電信公司架構(gòu)師時,已經(jīng)是底氣十足、自信滿滿,將V3產(chǎn)品的存儲特性、性能、可靠性、易用性、工具與功能一一講解,以極佳的專業(yè)性順利打動客戶之后,華為存儲產(chǎn)品又順利通過了POC測試,該家客戶也一次性采購了華為存儲多套高端存儲產(chǎn)品。

2015年,瑞典一家世界級的機械制造公司開始加大自動駕駛在產(chǎn)品中的應(yīng)用,由于機器學(xué)習(xí)和深度學(xué)習(xí)需要不斷對數(shù)據(jù)進行訓(xùn)練,并且數(shù)據(jù)是千億級的海量小圖片、小視頻,傳統(tǒng)分布式存儲通常是大文件、大帶寬的,很難適合像自動駕駛這種AI訓(xùn)練場景,該公司架構(gòu)師在與華為存儲團隊交流中吐槽,因為不同場景的需求,多套不同存儲來跑不同的應(yīng)用,又開始產(chǎn)生了數(shù)據(jù)煙囪。

對此,該公司架構(gòu)師與華為存儲討論,能不能通過一套分布式存儲來支撐數(shù)據(jù)湖,除了自動駕駛業(yè)務(wù)之外,還能滿足車聯(lián)網(wǎng)、傳統(tǒng)CAD與CAE等應(yīng)用。于是,華為存儲決定與該客戶進行聯(lián)合創(chuàng)新,研發(fā)一套分布式存儲支撐所有應(yīng)用集成。

接下來,華為存儲與該客戶緊密合作,跟客戶探討每一個功能如何設(shè)計、參數(shù)如何設(shè)計,并且在每個場景中進行測試、部署與應(yīng)用。瑞典這家公司直接讓華為理解了新業(yè)務(wù)場景所帶來的挑戰(zhàn)以及需求?!懊嫦蛐碌膽?yīng)用場景,華為存儲必須走的快,而且需要與用戶一起做,不能閉門造車。”

回歸華為之后,華為存儲在海內(nèi)外與各個行業(yè)的頭部頂級客戶聯(lián)合創(chuàng)新日益增多,涉及到金融、電信、能源、媒資等多個領(lǐng)域,對于頭部客戶數(shù)據(jù)中心存儲需求和痛點有著極為深入的理解,也為日后產(chǎn)品創(chuàng)新和產(chǎn)品力的大幅提升奠定了堅實基礎(chǔ)。

簡而不減的秘訣

從2015年開始,海內(nèi)外包括金融、運營商、能源等多個行業(yè)的頭部客戶在與華為存儲交流的過程中,都提到了分布式,用戶們渴望在主數(shù)據(jù)中心的核心中部署分布式存儲,讓核心應(yīng)用也能夠享受到分布式存儲的好處。

“像荷蘭的一家電信公司,數(shù)據(jù)量當時都超過300PB了,非??释蚍植际降脑萍軜?gòu)轉(zhuǎn)型?!睆垏虮硎?,“他們希望分布式可以承載數(shù)據(jù)庫、虛擬機這些核心業(yè)務(wù),也能夠承載大數(shù)據(jù)、AI這些新應(yīng)用?!?/p>

這些客戶的需求直接促成了華為打造新一代智能分布式存儲—OceanStor分布式存儲。2016年,華為存儲迅速集結(jié)了集中式領(lǐng)域和分布式領(lǐng)域最優(yōu)秀的架構(gòu)師,一起攻關(guān)如何將分布式存儲和集中存儲融合在一個產(chǎn)品之中。

“這時候華為存儲平臺化的戰(zhàn)略優(yōu)勢就顯現(xiàn)出來了。華為研發(fā)的大部分力量都在平臺產(chǎn)品上,可以充分調(diào)動資源進行攻關(guān)?!睆垏蛲嘎叮斑@是其他公司很難去實現(xiàn)的,因為按照他們那種模式,投入的成本和時間極其大。”

同樣經(jīng)過兩年多的研發(fā),華為存儲在2019年正式發(fā)布了新一代智能分布式存儲-OceanStor分布式存儲。華為北京、上海、深圳、成都等地的存儲研發(fā)團隊跨地域緊密協(xié)同,設(shè)計出一套全新的存儲架構(gòu),進行了數(shù)千萬行代碼開發(fā),并先后進行了近十個版本的迭代,反復(fù)打磨、優(yōu)化的成果。

華為OceanStor分布式存儲產(chǎn)品不僅實現(xiàn)分布式存儲性能全球第一,單節(jié)點性能高端16.8萬 IOPS和1毫秒以內(nèi)時延,在業(yè)界標準SPC-1測試中排名第一;還首次在一套存儲中實現(xiàn)了同時支持塊、文件、對象、HDFS協(xié)議;并且,率先將人工智能技術(shù)融入到存儲全生命周期管理。

在OceanStor分布式存儲為用戶數(shù)據(jù)中心提供一套簡單卻功能強大的存儲背后,其實是研發(fā)團隊反復(fù)打磨與優(yōu)化的成果。比如,為解決性能波動的“隱形瓶頸”,華為存儲研發(fā)團隊動用了全球研發(fā)體系內(nèi)的操作系統(tǒng)調(diào)度專家、網(wǎng)絡(luò)專家,讓性能波動徹底解決,實現(xiàn)了非ARM節(jié)點14萬IOPS、ARM節(jié)點16.8萬IOPS的穩(wěn)定性能。

分布式存儲有三大難,其一是數(shù)據(jù)不一致情況如何解決,由于數(shù)據(jù)打散在各個節(jié)點上,很容易出現(xiàn)數(shù)據(jù)不一致的情況,尤其是在高性能、大并發(fā)的數(shù)據(jù)讀寫情況下如何保持數(shù)據(jù)一致性。這需要華為存儲在并發(fā)機制上做到精準無比。為此,華為存儲研發(fā)團隊研發(fā)出一套新的日志機制與工具,在海量數(shù)據(jù)中去追蹤和查看IO異常,實現(xiàn)了上千個節(jié)點不同場景下的數(shù)據(jù)不一致情況檢驗。

其二是分布式存儲功能與性能如何平衡,像重復(fù)數(shù)據(jù)刪除功能對存儲性能影響很大。為此,華為存儲研發(fā)團隊專門開發(fā)出一種加權(quán)算法,讓重刪功能實現(xiàn)自適應(yīng)調(diào)整,為用戶減去了過去需要不斷手動配置的復(fù)雜性,呈現(xiàn)出極為簡單的易用性。

最后則是如何防范數(shù)據(jù)丟失。通常,分布式存儲所承載的應(yīng)用場景是多樣化和復(fù)雜化,這也直接促使了數(shù)據(jù)丟失潛在因素的增多。針對這種情況OceanStor分布式存儲在只有64個字節(jié)的可靠性校驗的空間容納了30多個場景的預(yù)防方案,每個預(yù)防方案的“植入”需要精準到每個比特位,堪稱手術(shù)刀般精準。

高端存儲該變革啦!

這是一個真實的用戶故事。

某家世界級的物流公司,一套高端存儲上跑了4000臺服務(wù)器,按照傳統(tǒng)高端存儲的架構(gòu),如果做系統(tǒng)軟件升級,為防止前端多路徑運行不正常,必須在升級之前將4000多臺服務(wù)器的多路徑檢查一遍。客戶每次做升級,都猶如面臨世界末日般,處于崩潰邊緣。

這家公司的情況真實反映出很多用戶的囧境:應(yīng)用越來越多、業(yè)務(wù)越來越靈活,應(yīng)用環(huán)境正在快速變化,高端存儲需要有能力在數(shù)據(jù)中心承載起更多的業(yè)務(wù),過去只承載幾種業(yè)務(wù)的情況已經(jīng)一去不復(fù)返。

如今,高端存儲該進行變革啦。有人說,科技這個行業(yè)不尊重過去,只尊重創(chuàng)新,你不創(chuàng)新就只有等死。此時的華為,在全閃存技術(shù)、高端存儲架構(gòu)上的積累已經(jīng)完成,是時候打造出一款面向未來、滿足用戶數(shù)據(jù)中心極致需求的產(chǎn)品,讓高端存儲重新煥發(fā)新生機。

眾所周知,閃存對于存儲產(chǎn)業(yè)有著革命性的影響,全閃存存儲被認為是大勢所趨。而傳統(tǒng)高端存儲恰恰是基于傳統(tǒng)硬盤時代的產(chǎn)品,哪怕后來有廠商在高端存儲中加入閃存,也僅僅是一種優(yōu)化的妥協(xié)選擇。

全閃存,這是一條全新的賽道。在新賽道意味著你有機會實現(xiàn)對競爭對手的追趕,尤其是高端全閃存領(lǐng)域,將會是一次軟硬件架構(gòu)、功能堆棧的全面重塑。而華為在閃存領(lǐng)域已經(jīng)擁有深厚的積累。

其次,華為存儲在SmartMatrix高端存儲架構(gòu)上的經(jīng)驗,推動了下一代高端存儲在架構(gòu)上的進一步突破。華為存儲開始將Scale-Up和Scale-Out進行融合,采用了模塊化橫向擴展、所有關(guān)鍵部件全解耦全共享架構(gòu),并且融入了多項智能化技術(shù)。

2019年發(fā)布OceanStor Dorado V6新一代全閃存產(chǎn)品

2019年7月,歷時近三年的華為全新一代OceanStor Dorado V6系列產(chǎn)品正式亮相:擁有業(yè)界最高的2000萬IOPS極致性能,業(yè)界最低0.1ms的穩(wěn)定時延、控制器8壞7的極端情況依然工作、基于AI算法的全生命周期智能運維,并且可以實現(xiàn)故障0感知、業(yè)務(wù)0影響、升級0影響,真正保障用戶業(yè)務(wù)永久在線。

如果說華為存儲過去一直都算跟隨的話,那么OceanStor Dorado V6產(chǎn)品的驚艷亮相則標志著華為存儲開始引領(lǐng),它是華為存儲多年技術(shù)積累與創(chuàng)新的一次爆發(fā),讓大家看到了華為存儲走出了一條不一樣、具有開創(chuàng)性價值之路。

一抹丹青色,最是匠人心

存儲產(chǎn)品是數(shù)據(jù)的最終目的地,除了性能和效率之外,數(shù)據(jù)可用性和持久度、產(chǎn)品的可靠性等要求極為嚴格。做存儲的開發(fā)有時候就像打造一件復(fù)雜的藝術(shù)品,需要技術(shù)研發(fā)人員不斷的雕琢與打磨,追求完美的狀態(tài)。

“存儲對于工程師的匠心文化要求很高。因為代碼一不小心,可能整個盒子就崩了,會給用戶帶來災(zāi)難性的后果?!比A為存儲首席架構(gòu)師黃克驥如是說。

經(jīng)過長期積累,華為存儲軟件已經(jīng)達到幾千萬行代碼的規(guī)模,存儲研發(fā)團隊依然對每一行代碼都是高標準的質(zhì)量要求。例如,在重復(fù)數(shù)據(jù)刪除與壓縮領(lǐng)域,作為降低存儲成本、提升存儲效率最為有效的技術(shù),重刪壓縮被認為是衡量存儲產(chǎn)品水平的重要標志,但是重刪壓縮功能一旦出現(xiàn)問題,造成數(shù)據(jù)損壞或者丟失,其給用戶帶來的后果是極為嚴重。因此,華為對于重刪壓縮測試極為嚴格,嚴防有Bug遺漏,不斷打磨代碼,做到萬無一失。

在硬件層面,華為存儲有專門的可靠性團隊和專業(yè)的可靠性實驗室對各種硬件組件進行測試,尋找可能存在的漏洞,在可靠性方面不停的精益求精。

“華為存儲研發(fā)一線有很多低調(diào)、才華橫溢的人才。”黃克驥介紹到。

比如有這么一位癡迷于代碼的技術(shù)大咖,融合存儲文件系統(tǒng)是他編寫的、復(fù)制核心模塊是他編寫的、全閃存架構(gòu)核心模塊是他編寫的、重復(fù)數(shù)據(jù)刪除模塊也是他編寫的,這位代碼大神從華為歷史上企業(yè)級到分布式核心模塊都寫過?!八磉_方式就是代碼,我們都說他是個掃地僧,普華務(wù)實的外表下藏著萬丈光芒?!?/p>

“除了專注之外,華為非常看重研發(fā)人才的全棧能力。何為全棧能力,就是技能全?;蜆I(yè)務(wù)全棧化?!表楋w介紹道。在技能全?;矫?,華為要求開發(fā)必須懂測試,測試必須懂產(chǎn)品設(shè)計、后端維護,通過崗位輪換讓研發(fā)人員把這些技能拉通,從而變得更加全面;又比如,在產(chǎn)品架構(gòu)內(nèi),華為會通過讓員工在不同子系統(tǒng)研發(fā)的方式讓員工盡可能多掌握技術(shù);此外,華為還會讓研發(fā)定期去前端支持銷售和后端支持服務(wù)等等。

以存儲架構(gòu)師為例,在華為存儲有不成文的規(guī)定:架構(gòu)師也需要寫代碼。有些架構(gòu)師,從RAID 2.0功能到華為OceanStor存儲Dorado系列V3、V6兩代產(chǎn)品都是自己做架構(gòu)、寫代碼,長期保持這種狀態(tài)。以至于華為存儲內(nèi)部人打趣道:“不會寫代碼的存儲架構(gòu)師不是好的存儲售前?!?/p>

一抹丹青色,最是匠人心——用來詮釋華為存儲的匠心精神再恰當不過。

未來征途似星辰大海

如今,存儲產(chǎn)業(yè)又站在下一個變革的十字路口。

人工智能技術(shù)的不斷成熟與應(yīng)用,正在深刻影響著存儲產(chǎn)業(yè)。融入人工智能技術(shù)的智能存儲被認為是重要的趨勢,它希望本質(zhì)上解決過去存儲操作、運維復(fù)雜化的情況,讓存儲變得更加簡單化。

“智能會成為存儲的基礎(chǔ)能力?!比A為數(shù)據(jù)存儲與機器視覺產(chǎn)品線總裁周躍峰表示:“未來的存儲首先需要Storage for AI,能夠幫助用戶更好地利用智能技術(shù),滿足像AI訓(xùn)練、應(yīng)用的需求;其次是AI in Storage,就是將AI技術(shù)融入到存儲全生命周期,讓存儲管理、性能、效率、維護更加出色?!?/p>

華為在智能存儲的探索上一直走在業(yè)界的最前沿。華為OceanStor存儲Dorado V6產(chǎn)品是業(yè)界首個AI加持的高端存儲系統(tǒng),并且在重刪壓縮算法、智能存儲運維等方面大量運用了機器學(xué)習(xí)的方式,通過AI+智能算法實現(xiàn)了存儲系統(tǒng)的智能自調(diào)優(yōu),可以讓存儲可以越用越好。

但智能存儲依然有很長的路要走,現(xiàn)階段智能存儲主要是解決了故障定位與業(yè)務(wù)管理等運維優(yōu)化工作,以及一些基于AI的智能Cache算法、重刪壓縮算法等等,讓一些專業(yè)化的存儲操作變成自動化。未來,存儲也會類似自動駕駛那樣,會根據(jù)不同的負載情況和業(yè)務(wù)場景來智能化選擇相應(yīng)的存儲功能與技術(shù)。

除此之外,在數(shù)據(jù)成為數(shù)字經(jīng)濟最關(guān)鍵的生產(chǎn)要素時,存儲作為數(shù)據(jù)基礎(chǔ)設(shè)施重要的一環(huán),依然存在著非常多的挑戰(zhàn)。幫助企業(yè)實現(xiàn)數(shù)據(jù)“存得下、流得動、用得好”,需要包括華為存儲在內(nèi)的所有存儲廠商繼續(xù)探索。

“我們的征途似星辰大海,從此只顧風雨兼程?!薄A為存儲一直在路上。

尾記:《華為存儲成人禮:我們的征途似星辰大海》四篇連載已經(jīng)結(jié)束。雖是萬字長文,但亦無法將華為存儲十八年歷程一一展示。謹以此文向中國存儲產(chǎn)業(yè)從業(yè)者致敬,望大家不忘初心,砥礪前行!

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-06-24
華為存儲成人禮:我們的征途似星辰大海
采用開源路線,意味著可以加速產(chǎn)品研發(fā)成功的速度,這對于初涉存儲領(lǐng)域的華為而言,不失為一條“捷徑”,但開源也普遍存在著代碼與功能相對簡單、效率較低、Bug較多等情況;而從一開始就走創(chuàng)新路線的話,意味著需

長按掃碼 閱讀全文