英偉達黃仁勛:“新架構(gòu),芯片買得越多越省”

9月25日消息(茜茜)沒有擠牙膏,英偉達又在游戲、汽車芯片、專業(yè)視覺領(lǐng)域放出“核彈群”。當?shù)貢r間9月22日,英偉達2022秋季GTC大會上,英偉達發(fā)布一系列重磅新品。

具體包括GeForce RTX 40系列、用于自動駕駛、醫(yī)療儀器、機器人等領(lǐng)域的“雷神”Thor芯片、全新架構(gòu)Ada Lovelace、提升圖像質(zhì)量和性能的DLSS 3技術(shù)、第二代OVX計算系統(tǒng)、為創(chuàng)作者和設(shè)計師服務(wù)的RTX 6000 GPU、針對數(shù)據(jù)中心的L40 GPU等。

此次,GeForce RTX 40基于英偉達全新架構(gòu)Ada Lovelace。據(jù)英偉達CEO黃仁勛介紹,Ada Lovelace改進了所有三個RTX處理器,即神經(jīng)渲染引擎。在Ada Lovelace架構(gòu)下,相同功耗,Ada Lovelace比上一代架構(gòu)Ampere帶來兩倍性能提升。

在Ada Lovelace架構(gòu)支持下,GeForce RTX 40系列具有83 TFLOPS著色器能力,吞吐量超過上一代產(chǎn)品兩倍;RT Cores有效光追蹤計算能力達到191 TFLOPS,是上一代產(chǎn)品2.8倍;Tensor Cores具有1.32 Petaflops的FP8張量處理能力,超上一代五倍......

據(jù)了解,RTX 4090采用臺積電4nm制程工藝和美光科技的G6X存儲芯片,其含760億個晶體管、16384個CUDA核心和24 GB GDDR6X顯存,最大boost頻率2.52GHz,官方售價12999元起。RTX 4080則擁有16GB和12GB兩個版本。

其中,16GB版本在現(xiàn)代游戲中性能達到RTX 3080 Ti的兩倍,兩款售價分別為9499元起、7199元起。

另一個重磅更新來自于“雷神”Thor芯片。去年,英偉達剛剛發(fā)布完算力為1000TOPS的Atlan。今年,英偉達直接略過Atlan,取而代之發(fā)布了一款算力更高的“雷神”Thor芯片,算力達到驚人的2000TOPS。

黃仁勛表示,Thor搭載了700億個晶體管,Thor吞吐量是Atlan兩倍,交付性能也是Atlan兩倍以上,Thor強悍性能基于Grace、Hopper、Ada Lovelace三種架構(gòu)。“平臺集Hopper的Transformer Engine,基于Grace GPU、Ada GPU于一身?!?/p>

顯然,Thor定位和功能也更加綜合,未來或?qū)崿F(xiàn)汽車主動安全、停車、駕駛員監(jiān)測、攝像頭后視鏡、集群和車載信息娛樂等功能計算設(shè)備控制的“大一統(tǒng)”。

黃仁勛稱,“Thor可以配置多種模式,算力可全部用于自動駕駛工作流,也可以將其配置為一部分用于駕駛艙AI和信息娛樂,一部分用于自動駕駛?!?/p>

此外,依托于Ada Lovelace架構(gòu)的DLSS 3技術(shù),具有高于傳統(tǒng)渲染四倍的性能和響應(yīng)速度,具有光學(xué)多幀生成功能,可以生成全新幀。新光流加速器可以分析兩幀連續(xù)的游戲圖像,并計算幀到幀中物體和遠速的運動矢量數(shù)據(jù)。英偉達還宣布H100 GPU全面投產(chǎn),未來幾周陸續(xù)發(fā)貨。

其實,可以發(fā)現(xiàn),無論是GeForce RTX 40、RTX 6000 GPU,還是DLSS3技術(shù)、OVX計算系統(tǒng)、L40均基于英偉達的新架構(gòu)Ada Lovelace。會后,中國區(qū)高級技術(shù)市場經(jīng)理施澄秋對媒體詳細介紹了此次發(fā)布會的技術(shù)亮點。

施澄秋介紹,英偉達全新Ada Lovelace架構(gòu)無論在半導(dǎo)體規(guī)模、制程、設(shè)計,還是內(nèi)部核心,整個架構(gòu)、核心數(shù)量、算力、顯存帶寬、VP處理器部署規(guī)模都不一樣?!霸S多Partition、Layout、三大功能處理器均有全新布局和變化?!?/p>

“相同面積下可以放更多晶體管,或者增大面積同時引入新半導(dǎo)體制程,同時功耗會大幅度降低。所以,新的架構(gòu)下,用得越多,功耗反而可能會降得更低,即相同算力下性能功耗比兩倍提升?!?/p>

施澄秋進一步對解釋,基于Ada Lovelace架構(gòu),RTX 6000、L40性能提升,因為單體性能提升更多,更加便于數(shù)據(jù)中心集群服務(wù)器部署。同時,對算力網(wǎng)和云廠商而言也要確保整個場地、電力、帶寬、延遲都有相應(yīng)配套的提升。

隨著算力和性能的提升,在企業(yè)級專業(yè)可視化運算領(lǐng)域,英偉達能更好地滿足專業(yè)可視化用戶對圖像編解碼性能的巨大需求?!皬V播、傳媒、娛樂需要實時處理4K、8K視頻流,而英偉達這一代產(chǎn)品有大規(guī)模三路Encoder和三路Decoder,3+3架構(gòu),整個視頻處理核心增量可以稱為‘超大杯’?!?/p>

此外,復(fù)雜的圖像計算和編解碼性能,離不開大規(guī)模本地顯存部署。相比于消費級產(chǎn)品輕量化的特征,企業(yè)級市場上,英偉達依舊采用48GB GDDR6部署。施澄秋認為,企業(yè)級產(chǎn)品魅力在于支持ECC校驗,擁有超大本地顯存,無需導(dǎo)入超大規(guī)模3D建模、模擬、渲染AI數(shù)據(jù)資產(chǎn)和數(shù)據(jù)集等。

技術(shù)解析會上,施澄秋重點推介了英偉達Omniverse平臺,以及Omniverse開發(fā)工具幾項重大更新。在施澄秋看來,Omniverse平臺承載了數(shù)字孿生、5G、6G、智能工廠、智慧城市、VR/AR、機器人、物聯(lián)網(wǎng)等以往我們算力難以企及的應(yīng)用場景。

據(jù)悉,英偉達GTC2021大會上,發(fā)布聚焦于仿真以及可視化的云原生平臺Omniverse后,在功能和生態(tài)上持續(xù)更新。今年年初,英偉達剛對Omniverse平臺上Create、Machinima、Showroom等應(yīng)用進行更新,并宣布將推出更新版本View。

本次秋季GTC大會上,英偉達發(fā)布了針對虛擬形象的Avatar Cloud Engine技術(shù),高清多人大容量視頻會議Maxine SDK,基于云原生Omniverse一系列的開發(fā)工具、數(shù)據(jù)存儲、數(shù)據(jù)調(diào)度,全新云原生Omniverse Cloud進展。目前,已經(jīng)有包括WPP、Lowe、德國國家鐵路等通過Omniverse構(gòu)建數(shù)字孿生模型。

值得注意的是,2022秋季GTC大會上,英偉達特別提出GDN的新概念,GDN概念由CDN概念衍生而來。CDN顧名思義,Content Delivery Network,當用戶打開電商、短視頻等互聯(lián)網(wǎng)平臺時,服務(wù)器分布在國內(nèi)各個地方,在通過用戶所在網(wǎng)絡(luò)和路由自動選擇距離最近、網(wǎng)速最快、帶寬影響最小的服務(wù)器傳輸內(nèi)容。而GDN則是英偉達提供高品質(zhì)、Premium圖形運算流,能夠讓用戶在邊緣設(shè)備上獲得體驗。

“英偉達收購了很多有潛力的廠商,比如中國的DeepMap,導(dǎo)入英偉達的Drive Sim,可以在Omniverse更好地完成自駕車元宇宙數(shù)字孿生的路訓(xùn)、測試等。再比如,今天OVX服務(wù)器采用Omniverse的網(wǎng)絡(luò)平臺、網(wǎng)絡(luò)技術(shù)構(gòu)建元宇宙的數(shù)據(jù)傳輸,大規(guī)模、大帶寬的數(shù)字資產(chǎn)調(diào)度,并利用直接接入的方式。這些廠商都在Omniverse上扮演著重要角色。滿足用戶的需求,更好地使用英偉達已有的資源是英偉達的收購邏輯?!笔┏吻镎f。

?

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-09-25
英偉達黃仁勛:“新架構(gòu),芯片買得越多越省”
英偉達又提升了自己的上限。

長按掃碼 閱讀全文