【IT168 評論】熟悉服務(wù)器領(lǐng)域的朋友,必然對浪潮K1小型機(jī)或多或少有所了解。在當(dāng)年關(guān)鍵業(yè)務(wù)主機(jī)市場寡頭壟斷的格局下,浪潮400多位工程師耗費(fèi)4年時(shí)間,于2010年成功研制出了K1小型機(jī),為市場注入一股新的血液。使得中國成為除美國、日本之外全球第三個(gè)具備關(guān)鍵應(yīng)用主機(jī)研制能力的國家,浪潮也成為全球第五家具備關(guān)鍵應(yīng)用主機(jī)研制能力的企業(yè)。
經(jīng)過多年的發(fā)展,K1小型機(jī)獲得了市場的廣泛接納與認(rèn)可,受到來自金融、交通、政務(wù)、能源、醫(yī)療等眾多關(guān)鍵行業(yè)客戶的青睞。與此同時(shí),K1家族產(chǎn)品也不斷升級迭代,持續(xù)以強(qiáng)勁性能與靈活可靠的特性,支撐其客戶關(guān)鍵業(yè)務(wù)應(yīng)用的高效平穩(wěn)運(yùn)行。
而隨著2018年浪潮與IBM的合資公司——浪潮商用機(jī)器的成立,K1的發(fā)展路線圖中更是出現(xiàn)了Power的身影。于是,國產(chǎn)關(guān)鍵業(yè)務(wù)主機(jī)的先行者K1,進(jìn)入了一個(gè)新的發(fā)展階段。浪潮K1小型機(jī)領(lǐng)先的核心技術(shù)與系統(tǒng)設(shè)計(jì)理念,再加上Power處理器強(qiáng)大的性能表現(xiàn),浪潮商用機(jī)器K1 Power系列服務(wù)器由此誕生。
浪潮商用機(jī)器有限公司副總經(jīng)理黃家明
據(jù)浪潮商用機(jī)器有限公司副總經(jīng)理黃家明介紹,浪潮商用機(jī)器分別在北京、濟(jì)南兩地建立了Power系統(tǒng)研發(fā)實(shí)驗(yàn)室,都配備了專業(yè)的電子設(shè)計(jì)自動(dòng)化工具(EDA)。K1 Power研發(fā)團(tuán)隊(duì)目前有上百位核心人員,均來自于浪潮K1小型機(jī)研發(fā)團(tuán)隊(duì),擁有10年以上高端服務(wù)器設(shè)計(jì)經(jīng)驗(yàn),是目前國內(nèi)高端服務(wù)器研發(fā)領(lǐng)域最優(yōu)秀的團(tuán)隊(duì),具備從系統(tǒng)原理到主板PCB設(shè)計(jì)的全流程設(shè)計(jì)能力。此外,實(shí)驗(yàn)室還配備了頂級硬件研發(fā)測試平臺,以快速診斷問題,保障產(chǎn)品的高可靠性。
那么,K1 Power服務(wù)器究竟是怎樣煉成的?其卓越的性能與可靠性背后是哪些關(guān)鍵技術(shù)在做支撐?在有幸參加了浪潮商用機(jī)器“探秘K1 Power研發(fā)之旅”活動(dòng)之后,筆者終于對此有了一個(gè)大體的了解,下面就一一為大家揭秘。
高速內(nèi)核——POWER9帶來卓越的性能表現(xiàn)
服務(wù)器的性能表現(xiàn)自然取決于CPU。與X86處理器相比,最新的POWER9處理器具有顯著的性能優(yōu)勢,可以說就是為應(yīng)對數(shù)據(jù)密集型工作負(fù)載、滿足嚴(yán)苛的高性能計(jì)算需求而生。
上圖是Power 9與X86處理器的橫向?qū)Ρ?,我們可以看到,從主頻到帶寬,POWER9均能夠提供兩倍以上的性能提升。與絕大多數(shù)X86處理器不同,POWER9支持最新的PCIe 4.0以及NVLink2.0協(xié)議,以此帶來極大的內(nèi)存與I/O帶寬優(yōu)勢,加速CPU與GPU間的通信,滿足更高的應(yīng)用負(fù)載運(yùn)行要求。
像K1 Power這樣的中高端服務(wù)器,通常用于承載組織的核心數(shù)據(jù)庫應(yīng)用,因此在判斷其性能優(yōu)劣時(shí),對數(shù)據(jù)庫負(fù)載的支持是一個(gè)很好的依據(jù)。據(jù)浪潮商用機(jī)器有限公司產(chǎn)品研發(fā)部副總經(jīng)理尹宏偉介紹,在實(shí)際測試中,K1 Power服務(wù)器對于EDB、DB2和Oracle、SAP等商業(yè)數(shù)據(jù)庫以及MySQL等開源數(shù)據(jù)庫,都能帶來相對X86服務(wù)器兩倍以上的性能提升。
此外還有非常值得一提的一點(diǎn),是K1 Power對計(jì)算資源的高利用率。由于K1 Power服務(wù)器具備強(qiáng)大的性能,因此可以在單臺服務(wù)器中以分區(qū)的形式滿足更多應(yīng)用負(fù)載——作為對比,x86服務(wù)器往往是一臺服務(wù)器運(yùn)行一個(gè)應(yīng)用,通過部署更多服務(wù)器來運(yùn)行更多應(yīng)用。因此在實(shí)際運(yùn)行時(shí),K1 Power服務(wù)器的整機(jī)硬件負(fù)載效率更高,資源利用率更高。
極致可靠——全棧可靠性設(shè)計(jì)理念,保障業(yè)務(wù)持續(xù)運(yùn)行
對于K1 Power服務(wù)器而言,在提供優(yōu)越性能的前提下,保證整個(gè)系統(tǒng)的高度可靠是一個(gè)同樣重要的課題。K1 Power服務(wù)器系統(tǒng)的可靠性設(shè)計(jì)遵循高RAS(可靠性Reliability、可用性Availability、可服務(wù)性Serviceability)特性理念,此外還加入了獨(dú)立的服務(wù)處理器FSP,全方位偵測潛在故障,幫助及時(shí)修復(fù),確保系統(tǒng)持續(xù)平穩(wěn)運(yùn)行。
K1 Power系統(tǒng)全堆??煽啃栽O(shè)計(jì)包括:冗余、捕獲、重試、隔離、修復(fù)。針對每一個(gè)環(huán)節(jié),都通過領(lǐng)先的技術(shù)保證有效性,從而在整體上提供高達(dá)99.9994%的可靠性。
·冗余。K1 Power服務(wù)器通過冗余設(shè)計(jì)保證系統(tǒng)持續(xù)運(yùn)行:1、在硬件上,包括DRAM內(nèi)存芯片、CPU與內(nèi)存/CPU與CPU之間的鏈路等都是冗余的;2、每個(gè)系統(tǒng)控制單元中有兩個(gè)冗余的時(shí)鐘卡,當(dāng)任意一個(gè)時(shí)鐘卡出現(xiàn)故障,另一組時(shí)鐘可以無縫切換;3、電源時(shí)序控制信號如Enable,Power good等做冗余設(shè)計(jì),能實(shí)現(xiàn)更加可靠的電源開關(guān)控制;4、電源穩(wěn)壓模塊(VRM)實(shí)現(xiàn)N+2冗余設(shè)計(jì),以減少單點(diǎn)故障率;5、K1 Power系統(tǒng)關(guān)鍵部件如電源、 SMP線纜、時(shí)鐘、FSP模塊、I/O控制器等全部冗余設(shè)計(jì)。
·捕獲。K1 Power服務(wù)器裝載了多達(dá)16萬個(gè)故障檢查器,可以實(shí)時(shí)監(jiān)測系統(tǒng)運(yùn)行狀態(tài)。此外,還采用首錯(cuò)數(shù)據(jù)捕獲(FFDC,F(xiàn)irst Failure Data Capture)的機(jī)制,在設(shè)計(jì)階段就進(jìn)行錯(cuò)誤模擬,在實(shí)際運(yùn)行階段進(jìn)行錯(cuò)誤捕獲。而發(fā)生錯(cuò)誤之后,還可以在維護(hù)階段進(jìn)行錯(cuò)誤重現(xiàn)。將所有可能產(chǎn)生的錯(cuò)誤提前做到預(yù)警、備案和處理。
·重試。通過校驗(yàn)與重試設(shè)計(jì),讓軟錯(cuò)誤不影響整體系統(tǒng)運(yùn)行。除了內(nèi)存或者緩存本身的糾錯(cuò)機(jī)制外,K1 Power服務(wù)器還設(shè)計(jì)了重試機(jī)制,判斷某個(gè)故障是不是偶發(fā)性的。其中,內(nèi)存的控制器或指令集的重試機(jī)制,是Power服務(wù)器特有的。
·隔離與修復(fù)。在發(fā)生故障時(shí),K1 Power服務(wù)器可實(shí)現(xiàn)細(xì)粒度的隔離,如單個(gè)CPU核心隔離,邏輯內(nèi)存塊隔離。x86服務(wù)器CPU內(nèi)部某一個(gè)區(qū)域或某一個(gè)功能發(fā)生故障時(shí),往往整個(gè)CPU就會(huì)故障。Power處理器可以將發(fā)生故障的核心單獨(dú)隔離,同時(shí)處理器能繼續(xù)工作,從而實(shí)現(xiàn)在線修復(fù)/更換。
鋼鐵之軀——高品質(zhì)工藝,更嚴(yán)苛的標(biāo)準(zhǔn)與測試
服務(wù)器的高可靠性的實(shí)現(xiàn)不止依靠系統(tǒng)設(shè)計(jì),同樣還取決于優(yōu)秀的制造工藝。K1 Power服務(wù)器采用了嚴(yán)格的元器件和部件選型標(biāo)準(zhǔn),并在極限環(huán)境下進(jìn)行嚴(yán)苛的測試,力求打造高品質(zhì)平臺。從物理層面上,進(jìn)一步提升系統(tǒng)整體可靠性。
由于POWER處理器都是高速信號,因此為了保證信號在CPU、內(nèi)存、I/O以及加速器之間傳遞的穩(wěn)定性,K1 Power服務(wù)器采用了高達(dá)40層的高復(fù)雜主板設(shè)計(jì),所有與高速信號走線層相鄰的平面層都是地平面,保證高速信號良好的完整性。此外,主板也需經(jīng)過更嚴(yán)苛的板機(jī)測試,以保證100%可靠出貨。
在散熱方面,K1 Power服務(wù)器采用了更高效的散熱設(shè)計(jì)和散熱管理。其導(dǎo)熱材質(zhì)選用銦金屬片,將導(dǎo)熱效率提升了近10倍。而且銦金屬片相對于傳統(tǒng)x86采用的導(dǎo)熱膏來說,導(dǎo)熱穩(wěn)定性更強(qiáng),保障長期使用。K1 Power服務(wù)器散熱管理采用了動(dòng)態(tài)分區(qū)散熱控制技術(shù)。這種動(dòng)態(tài)、智能化的散熱控制,既提高了散熱的利用效率,也保障了CPU等元器件的壽命以及性能穩(wěn)定。
K1 Power服務(wù)器采用了高標(biāo)準(zhǔn)的檢測,生產(chǎn)測試功能覆蓋率100%,高端機(jī)型測試大項(xiàng)共計(jì)660多項(xiàng),同時(shí)測試?yán)匣瘯r(shí)間達(dá)到48小時(shí)以上。通過自動(dòng)化的測試系統(tǒng),確保每臺機(jī)器的檢測的有效性?;趪?yán)苛的測試環(huán)境,確保每臺服務(wù)器都能夠在極限電壓和動(dòng)態(tài)頻率下穩(wěn)定工作,保證品質(zhì)達(dá)到業(yè)界最高水準(zhǔn)。
不懼威脅——自下而上的安全加固,保護(hù)業(yè)務(wù)數(shù)據(jù)
在關(guān)鍵業(yè)務(wù)場景下,系統(tǒng)安全性是至關(guān)重要的。K1 Power服務(wù)器在系統(tǒng)安全方面也進(jìn)行了充分的考慮,支持多種國際標(biāo)準(zhǔn)和中國政府認(rèn)證。與此同時(shí),并不僅僅依賴于操作系統(tǒng)層面的安全性,還會(huì)在更底層的技術(shù)層面進(jìn)行加固。
一個(gè)非常具有代表性的舉措是,K1 Power服務(wù)器所有部件的維護(hù)都需要通過認(rèn)證,新更換的部件在沒有認(rèn)證之前是無法運(yùn)行的,這樣可以有效避免非認(rèn)證部件導(dǎo)致的可靠性問題,保證整個(gè)系統(tǒng)的一致性。
在操作系統(tǒng)方面,包括浪潮KUX在內(nèi)的多家本地安全可信操作系統(tǒng)廠商認(rèn)證了Power服務(wù)器平臺,并取得了產(chǎn)品兼容性認(rèn)證證書。另外,通過浪潮具有自主知識產(chǎn)權(quán)的操作系統(tǒng)安全加固模塊SSR(國家等保三級認(rèn)證),進(jìn)一步保障系統(tǒng)安全無虞。
最后
不難看出,繼承了浪潮K1小型機(jī)核心技術(shù)積累和自主創(chuàng)新能力,再融合POWER處理器出色計(jì)算能力的K1 Power服務(wù)器,既立足于實(shí)際場景需求,實(shí)現(xiàn)更精細(xì)化的設(shè)計(jì);同時(shí)在生產(chǎn)的每一個(gè)環(huán)節(jié)都以高標(biāo)準(zhǔn)、高水準(zhǔn)嚴(yán)格要求。這樣的服務(wù)器平臺,無疑能夠成為支撐關(guān)鍵業(yè)務(wù)應(yīng)用持續(xù)穩(wěn)定運(yùn)行的可靠基石。
- 剪映海外版回歸美國:短視頻創(chuàng)作工具再戰(zhàn)江湖
- 全球IT大手筆:數(shù)據(jù)中心系統(tǒng)支出飆升,去年IT支出破5萬億美元
- 蘋果市值一夜蒸發(fā)超千億美元,蔚來機(jī)器狗項(xiàng)目蓄勢待發(fā),科技巨頭風(fēng)云變幻
- 比亞迪印尼工廠年底竣工:投資10億造新能源車,年產(chǎn)能達(dá)15萬輛,加速東南亞綠色出行
- 蔚來汽車銷量飆漲,1月前三周同比猛增近150%,領(lǐng)跑新能源汽車市場
- 谷歌押注AI未來,向Anthropic新投10億美元,搶占OpenAI競爭高地
- 春節(jié)臨近,打車需求大漲,哈爾濱三亞異地需求成熱點(diǎn)
- 本田汽車AEB系統(tǒng)問題引爆美國監(jiān)管機(jī)構(gòu)調(diào)查:30萬輛車遭殃,消費(fèi)者權(quán)益受挑戰(zhàn)
- 中國制造崛起:2024年破繭而出,超40萬億產(chǎn)值領(lǐng)跑全球,創(chuàng)新力破繭成蝶
- 印尼與蘋果接近達(dá)成投資協(xié)議:iPhone 16系列有望重返印尼市場
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。