三年打造AI芯片黑科技,IBM“狩獵女神之矛”將撬動企業(yè)混合云

三年打造AI芯片黑科技,IBM“狩獵女神之矛”將撬動企業(yè)混合云

(IBM最新推出的芯片內(nèi)加速型人工處理器Telum)

IBM是當(dāng)今世界為數(shù)不多的具備CPU芯片設(shè)計與制造能力的公司之一,也是企業(yè)級混合云與AI的領(lǐng)導(dǎo)廠商之一。作為IT產(chǎn)業(yè)唯一一家具有百年歷史的高科技企業(yè),IBM始終以制造下一代“商業(yè)機器”為己任。早在1960年4月,在一份給IBM管理者的備忘錄中,當(dāng)時的首席執(zhí)行官小沃森談及IBM面臨的問題是制造“會思考的機器”。如今,60多年過去了,聚集于企業(yè)市場的IBM在“會思考的商業(yè)機器”方面,創(chuàng)造了歷史性的進步。

2021年8月23日,IBM在年度Hot Chip Conference大會上,推出了歷時大約三年研發(fā)的帶有片內(nèi)AI加速器的7納米處理器Telum,將CPU計算核與AI計算核集成到一個芯片上,可以同時處理傳統(tǒng)企業(yè)計算以及AI計算任務(wù),例如在處理金融交易的同時進行實時防欺詐AI推理計算,讓銀行、零售商、保險商等能夠?qū)崟r攔截惡意欺詐而不是在事后追回。要知道,僅美國消費者在2020年就因欺詐而損失高達33億美元,而在2019年才為18億美元。

IBM表示,基于Telum芯片的商用硬件系統(tǒng)將在2022年上半年推出。在預(yù)熱溝通會上,IBM Z & LinuxONE產(chǎn)品管理副總裁Barry Baker介紹,阿提米斯是希臘神話中的狩獵女神,而Telum即為阿提米斯手中的長矛名稱,因此Telum的命名即希望激發(fā)對“向前移動、速度和精準(zhǔn)”的思考。

筆者認為,考慮到IBM z14已經(jīng)實現(xiàn)一臺z14即一個企業(yè)混合云數(shù)據(jù)中心,那么基于Telum的IBM商用硬件系統(tǒng)無疑將重塑企業(yè)混合云與AI戰(zhàn)略。

“狩獵女神”的“獵物”

Telum芯片并不是IBM憑空想像而創(chuàng)造出來的黑科技。金融業(yè)務(wù)一直是被譽為企業(yè)級市場的“皇冠”,傳統(tǒng)銀行已經(jīng)是國民經(jīng)濟的支柱之一,而現(xiàn)代數(shù)字金融又已經(jīng)融入到了眾多行業(yè)企業(yè)的業(yè)務(wù)流程,在線保險、在線零售、在線醫(yī)療等等幾乎所有數(shù)字化轉(zhuǎn)型的企業(yè)和機構(gòu)都會涉及到在線交易。凡涉及到在線交易,就有金融欺詐的可能。AI人工智能在給企業(yè)帶來全新反金融欺詐技術(shù)的同時,又迫切需要從事后處理轉(zhuǎn)到實時處理,才能帶來更高商業(yè)價值。

三年打造AI芯片黑科技,IBM“狩獵女神之矛”將撬動企業(yè)混合云

(IBM Telum用于實時AI推理計算)

把AI用于實時反金融欺詐,面臨著三大挑戰(zhàn)。首先,以深度神經(jīng)網(wǎng)絡(luò)為代表的AI算法正在向需要更大模型、更大計算量、更大功耗的方向發(fā)展,這讓AI計算很難嵌入到實時的業(yè)務(wù)交易處理中;其次,目前已有的AI算法軟件,需要將數(shù)據(jù)從CPU芯片傳輸?shù)狡獾钠渌胤?,有時甚至要通過互聯(lián)網(wǎng)或企業(yè)網(wǎng)傳輸?shù)竭h處的數(shù)據(jù)中心進行AI計算后,再返回到數(shù)據(jù)源頭,這會導(dǎo)致由于數(shù)據(jù)傳輸延時而無法及時處理可能的欺詐行為;第三,即使將數(shù)據(jù)從CPU芯片傳輸?shù)酵挥布到y(tǒng)里的獨立AI加速卡,也會導(dǎo)致安全風(fēng)險。

IBM院士、IBM研究院加速器架構(gòu)和機器學(xué)習(xí)高級主管Kailash Gopalakrishnan表示,實時AI計算的挑戰(zhàn)帶來了每10年到30年才會發(fā)生一次的重大企業(yè)計算架構(gòu)變遷。上一次重大企業(yè)計算架構(gòu)變遷,以IBM Z主機和Power服務(wù)器為代表;而本次推出的Telum,其對企業(yè)計算的影響力和影響程度絕不亞于Z主機和Power服務(wù)器。

筆者認為,隨著Telum以及基于Telum的商用硬件系統(tǒng)的推出,AI在以混合云為代表的下一代企業(yè)計算中將真正無處不在——這才是“狩獵女神”的“獵物”。

三年鍛造“狩獵女神之矛”

Telum芯片設(shè)計是IBM全棧式系統(tǒng)設(shè)計的最新成果,結(jié)合了芯片設(shè)計、硬件系統(tǒng)、系統(tǒng)驅(qū)動和固件、操作系統(tǒng)和中間件等全棧的聯(lián)合優(yōu)化,而這一整套的全棧系統(tǒng)設(shè)計是為了滿足企業(yè)的關(guān)鍵業(yè)務(wù)計算需求。Telum作為下一代IBM微處理器芯片,可處理每秒鐘數(shù)以萬筆計的交易業(yè)務(wù),同時實時完成AI推理計算,也就是說新的芯片在一個數(shù)據(jù)流中、在毫秒級響應(yīng)時間內(nèi)同時完成傳統(tǒng)及AI兩種計算任務(wù),而不用把數(shù)據(jù)傳送到CPU以外的地方。

三年打造AI芯片黑科技,IBM“狩獵女神之矛”將撬動企業(yè)混合云

(IBM Telum可到32個芯片互聯(lián)的系統(tǒng))

Telum是IBM耗費三年的最新研究成果,是IBM研究院AI硬件中心首個研究成果的商用轉(zhuǎn)化產(chǎn)品,是IBM研究院、IBM Z產(chǎn)品部門以及產(chǎn)業(yè)生態(tài)伙伴(三星是7納米制程結(jié)點技術(shù)7nm EUV的產(chǎn)業(yè)合作伙伴)的聯(lián)合努力成果,也是CPU和AI加速器領(lǐng)域的最新黑科技。IBM Telum采用7納米制程結(jié)點工藝,這是當(dāng)今服務(wù)器芯片領(lǐng)域最先進的制造工藝,盡管IBM研究院于今年5月發(fā)布了全球首個2納米芯片制造工藝,但距離量產(chǎn)仍有相當(dāng)?shù)木嚯x。

7納米工藝的最大好處,就是可以在同樣尺寸的芯片上集成更多的晶體管,從而完成更多的計算任務(wù)。Telum芯片就包括了220億個晶體管,17層金屬層的線路總長達到19英里。這樣,Telum芯片就可以在同樣功耗甚至更低功耗下,容納更多的計算任務(wù),其中就包括了實時AI推理計算。

三年打造AI芯片黑科技,IBM“狩獵女神之矛”將撬動企業(yè)混合云

(IBM研究院AI硬件中心成立時的愿景)

Telum的研發(fā)工作,相當(dāng)一大部分源自IBM研究院的努力。2019年2月,IBM研究院專門成立了AI硬件中心,當(dāng)時就鑒于AI模型越來越大、計算量需求越來越大、功耗越來越高的現(xiàn)狀,試圖從半導(dǎo)體芯片設(shè)計開始徹底解決這一問題。成立之初,IBM研究院AI硬件中心的目標(biāo)就設(shè)定為將人工智能系統(tǒng)效率在未來十年提升千倍。具體說來,基于當(dāng)時技術(shù)的深度學(xué)習(xí)計算在2020年左右達到1TFlops/W,基于數(shù)字AI內(nèi)核技術(shù)深度學(xué)習(xí)計算在2022年左右達到接近10TFlops/W,而今年2月IBM研究院在ISSCC國際會議上發(fā)布的7納米4核AI加速芯片原型的能效比最高達到3.5TFlops/W、整數(shù)計算能效比最高達16.5TOPs/W,遠高于業(yè)內(nèi)水平。隨后,Telum芯片的單片AI計算能力則達到6TFlops/W。

“Flops/W”代表的是每瓦功耗所產(chǎn)生的算力,顯然增加單位面積晶體管數(shù)量并不能完全達成更高能效比的目標(biāo)。為此,IBM研究院從2017年開始著手研究提升AI芯片的能效比,也就是每年提升AI硬件計算能效比2.5倍,十年后提升千倍。除了芯片的制造工藝外,為了提升AI計算能效比,IBM從簡化AI算法入手,這就是超低精度AI算法。實際上,與傳統(tǒng)CPU的高精度浮點計算不同的是,AI計算是整數(shù)計算和矩陣計算的結(jié)合,因此用低精度浮點運算取代高精度浮點運算的同時保持AI模型的高質(zhì)量結(jié)果,就成為一個算法優(yōu)化方向。在2021 ISSCC大會上展示的IBM高能效7納米4核AI芯片原型,就采用了混合8位超低精度AI算法,即8位精度浮點計算用于AI訓(xùn)練和4位精度浮點計算用于AI推理。

除了超低混合精度AI算法、更低納米制造工藝外,Telum芯片還有很多創(chuàng)新之處,包括完全重新設(shè)計的緩存和片內(nèi)互聯(lián)技術(shù),實現(xiàn)了CPU計算核心和AI計算核心的片內(nèi)高速超低時延數(shù)據(jù)共享。其中,每個Telum計算核有32MB的L2緩存,這些L2緩存互聯(lián)形成256MB共享虛擬L3緩存以及每8個Telumn芯片形成2GB的共享虛擬L4緩存,這是能夠?qū)崿F(xiàn)片內(nèi)AI實時計算的關(guān)鍵之處。

簡而言之,三年打造的“狩獵女神之矛”,是多項IBM黑科技的集大成之作,將撬動企業(yè)混合云與AI平臺市場。

發(fā)展下一代企業(yè)混合云與AI平臺

Telum加速器將成為下一代高性能計算系統(tǒng)的核心。IBM Z處理器歷來有嵌入各種專項加速器的歷史,從而提升加密、壓縮等通用計算任務(wù)的性能。而Telum集成了多達6TFlops片內(nèi)AI算力,每個計算核都能夠動態(tài)利用整個片內(nèi)的計算資源,以最小化AI推理計算時延?;赥elum的下一代IBM Z系統(tǒng),可支持高達200TFLops的系統(tǒng)內(nèi)AI算力。由于采用了集成的加速器架構(gòu)并直接連接到片上緩存體系,Telum適用于企業(yè)關(guān)鍵業(yè)務(wù)。

三年打造AI芯片黑科技,IBM“狩獵女神之矛”將撬動企業(yè)混合云

為什么說IBM Telum是下一代企業(yè)級混合云與AI平臺呢?簡單理解,目前的IBM Z和LinuxOne主機已經(jīng)能夠?qū)崿F(xiàn)一臺主機即一個企業(yè)云數(shù)據(jù)中心,而IBM收購了Red Hat軟件資產(chǎn)后進一步將Red Hat Openshift開放混合云軟件與IBM主機結(jié)合,從而將IBM主機承載企業(yè)混合云的關(guān)鍵工作負載,也可以理解為成為企業(yè)混合云的“計算中心”。企業(yè)可以通過IBM主機管理外部的多云資源,同時用IBM主機的普遍加密技術(shù)處理企業(yè)敏感數(shù)據(jù)和應(yīng)用,并通過IBM主機完成混合云的安全保障。

除了極強的嵌入實時AI算力外,IBM Telum也具備極強的故障恢復(fù)和安全保護能力。Telum的安全執(zhí)行模式,改進了Hyper Protected Virtual Server的性能與可用性,提升了開發(fā)人員在可信計算環(huán)境中的云原生應(yīng)用開發(fā)能力。Hyper Protected Virtual Server是 IBM Secure Service Container for IBM Cloud Private的技術(shù)演進,讓開發(fā)人員能夠使用熟悉的工具和自動化的持續(xù)軟件交付管道,在私有、公有或混合云中進行開發(fā),并提供整個云原生應(yīng)用開發(fā)生命周期的安全性。而IBM還為Telum重新設(shè)計了8通道內(nèi)存接口,可以允許通道或DIMM在失效的時候,以透明的方式恢復(fù)數(shù)據(jù),而不影響計算響應(yīng)時間。

高度安全可信的IBM Telum系統(tǒng),讓企業(yè)可以更好地利用實時AI推理計算能力,在高速交易結(jié)果沒有完成之前就完成諸如欺詐分析的計算,從而及時攔截惡意交易。例如,今天的一家國際銀行用IBM Z系統(tǒng)的AI計算能力對信用卡授權(quán)流程進行處理,而不用使用遠程的AI推理應(yīng)用,就能在信用卡交易授權(quán)過程中檢測到欺詐行為;未來,該銀行需要在毫秒級別的交易響應(yīng)時間內(nèi)利用復(fù)雜的深度學(xué)習(xí)AI模型,實現(xiàn)每秒10萬筆交易、也就是今天交易量的十倍以上規(guī)模,同時還要達到低于毫秒級時延的每筆交易欺詐檢測,這就是Telum的設(shè)計目的——大規(guī)模高速運行關(guān)鍵業(yè)務(wù)交易與AI處理結(jié)合的計算。

Barry在預(yù)溝通中還介紹了Telum的其它潛在應(yīng)用場景。除了金融欺詐外,在零售領(lǐng)域由零售品牌商提供的積分獎勵計劃就有可能被零售店員或消費者利用獲利,這是零售行業(yè)的潛在欺詐行為。另一個零售行業(yè)的應(yīng)用場景是尋找銷售增長機會,也就是在消費者掃描商品并結(jié)算付費的過程中,零售商如何針對消費者個人的購買行為和已購商品,實時提供個性化的促銷,從而擴大消費者每次的“購買籃子”。

全文總結(jié):嵌入了AI加速器的IBM Telum芯片,是開創(chuàng)性的企業(yè)計算架構(gòu)。由于將實時AI推理計算集成到了CPU處理器中,企業(yè)可以達到毫秒級同時處理傳統(tǒng)業(yè)務(wù)交易和AI推理計算,這種集成了傳統(tǒng)關(guān)鍵計算任務(wù)與新型AI計算任務(wù)的微處理器架構(gòu)和毫秒級處理能力,將為混合云時代的企業(yè)帶來全新商業(yè)價值,也將開創(chuàng)每10-30年才出現(xiàn)一次的企業(yè)計算架構(gòu)革新。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )