9月5日消息,燧原科技在2022世界人工智能大會“算盡其用·定義AI算力中心新實踐”云端算力產(chǎn)業(yè)應(yīng)用論壇上正式發(fā)布云燧智算機(CloudBlazer POD)。云燧智算機是針對大規(guī)模、集約化人工智能算力應(yīng)用場景推出的高性能人工智能加速集群產(chǎn)品,通過一站式預(yù)集成人工智能加速硬件、一體化開發(fā)與管理平臺及配套人工智能應(yīng)用軟件與服務(wù),可廣泛應(yīng)用于數(shù)字政府、科研院所、科創(chuàng)平臺等企事業(yè)單位。
作為國內(nèi)已落地超千卡規(guī)模液冷AI集群的人工智能算力企業(yè),燧原科技的第一代和第二代“邃思”芯片均已實際應(yīng)用于大規(guī)模AI集群工程中,支撐融媒體生成、城市智能感知等多樣化場景。根據(jù)過往落地實踐,燧原科技發(fā)現(xiàn),人工智能數(shù)據(jù)中心因其軟件運維復(fù)雜,普遍具有方案選型難、各廠商產(chǎn)品兼容未知等痛點,而且數(shù)據(jù)中心部署交付周期長、溝通成本高、項目管理周期長。
云燧智算機采用一體化設(shè)計,是專為人工智能場景下計算、存儲、網(wǎng)絡(luò)、軟硬協(xié)同設(shè)計的標準化產(chǎn)品,提供高可用的整體安全設(shè)計,確保集群架構(gòu)擴展性能符合預(yù)期,提供包括采購、安裝、運維一體的交鑰匙方案。對數(shù)據(jù)中心的環(huán)境和IT計算資源提供全面的監(jiān)控和管理,提高集群部署、測試的質(zhì)量和效率,輔助用戶提升運營效益和降低運行成本,幫助用戶提升運維價值,為用戶實現(xiàn)AI算力中心從交付部署到后期上線及運維管理全生命周期中的優(yōu)異總擁有成本(TCO)。
云燧智算機代表了燧原科技經(jīng)過多個大規(guī)模工程實踐所形成的計算、網(wǎng)絡(luò)、存儲的整體設(shè)計:以全局優(yōu)化為目標,基于計算、存儲、管理網(wǎng)絡(luò)分離,全互聯(lián)無阻塞的網(wǎng)絡(luò)架構(gòu),結(jié)合高效的多級存儲方式,在強大的“邃思”芯片與CPU的異構(gòu)算力支撐下,云燧智算機能夠提供卓越的AI性能。
云燧智算機整體設(shè)計
基于雙碳目標以及綠色環(huán)保的總體趨勢,無論是新型數(shù)據(jù)中心的規(guī)劃建設(shè),以及東數(shù)西算的政策性要求,都對數(shù)據(jù)中心整體能效(Power Usage Effectiveness,PUE)有明確的優(yōu)化指標性要求。云燧智算機采用一體化冷板式液冷技術(shù),實現(xiàn)單節(jié)點8顆高性能人工智能芯片液冷散熱,通過液冷板等高效熱傳導部件將被冷卻對象的熱量傳遞到自然冷媒中,采用先進流量控制系統(tǒng),大幅提高流量變化范圍、降低能耗,擁有架構(gòu)簡約、系統(tǒng)可靠、智能監(jiān)控等特性,PUE可降至1.1及以下。
依托于“邃思”芯片核心能力,在典型配置下,云燧智算機每單元可達到8PFLOPS的TF32浮點算力,并且支持按需橫向擴容,可支持數(shù)千卡規(guī)模集群,突破E級算力,打造業(yè)界領(lǐng)先的超級算力集群。
目前算力構(gòu)成復(fù)雜,多CPU架構(gòu),多異構(gòu)計算單元,并且考慮到集群本身一般服務(wù)于多用戶、多場景的特性,如何能夠?qū)ι蠈佑脩羝帘蔚讓铀懔Ξ悩?gòu)性、賦能用戶高效開發(fā)與部署上線AI應(yīng)用,真正釋放集群作為生產(chǎn)力工具的價值——軟件是關(guān)鍵要素。
燧池智算平臺(CloudBlazer Station)是全棧式人工智能開發(fā)服務(wù)平臺和通用的大規(guī)模算力管理平臺,結(jié)合強大的云燧AI算力集群和先進的大規(guī)模算力資源調(diào)度,為用戶提供人工智能模型生產(chǎn)及應(yīng)用發(fā)布的全流程服務(wù),能夠一站式滿足復(fù)雜的人工智能業(yè)務(wù)場景對人工智能服務(wù)的需求。
燧池智算平臺(CloudBlazer Station)
大規(guī)模數(shù)據(jù)訓練超大參數(shù)量的巨量模型是人工智能的發(fā)展方向,“預(yù)訓練大模型+下游任務(wù)微調(diào)”的模型開發(fā)方式將極大提升企業(yè)的AI應(yīng)用開發(fā)效率,開發(fā)者只需要少量行業(yè)數(shù)據(jù)就可以快速開發(fā)出精度更高、泛化能力更強的AI模型。
而訓練出一個大模型,除了算法和數(shù)據(jù),還需要超大規(guī)模的算力支撐?;谠旗葜撬銠C所構(gòu)成的大規(guī)模集群解決方案采用高帶寬、全互聯(lián)拓撲架構(gòu),計算、存儲、管理網(wǎng)絡(luò)全分離,計算節(jié)點內(nèi)基于GCU-LARE2.0多芯互聯(lián)技術(shù)提供近1TB/s的互聯(lián)帶寬,跨節(jié)點互聯(lián)能力高達600Gb/s,可實現(xiàn)千卡級大規(guī)模集群高速互聯(lián),具備優(yōu)異的線性加速比以支撐超千億參數(shù)巨量模型的高效、并行訓練。
- GDC 2025年游戲行業(yè)現(xiàn)狀調(diào)查報告發(fā)布:PC游戲開發(fā)主導地位增強
- 英偉達高管預(yù)警:完全自動駕駛汽車尚需至少十年,行業(yè)需謹慎推進
- Instagram砸重金吸引創(chuàng)作者,推出Reels獎金計劃以抗衡TikTok
- 剪映海外版CapCut在美國恢復(fù)運營
- 消息稱去年全球IT支出超過5萬億美元 數(shù)據(jù)中心系統(tǒng)支出大幅增加
- 谷歌向OpenAI競爭對手Anthropic追加10億美元投資
- 滴滴:春節(jié)打車需求將上漲25% 哈爾濱三亞異地打車需求突出
- 字節(jié)跳動澄清:否認今年AI基礎(chǔ)設(shè)施投資超120億美元傳聞
- 蔚來發(fā)力機器狗項目,布局智能機器人市場
- 寒武紀與前CTO梁軍對簿公堂,股權(quán)激勵損失索賠高達42.87億元
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。