更低成本、更高效率:英特爾Gaudi 2D面向DeepSeek優(yōu)化

近日,DeepSeek發(fā)布Janus Pro模型,其超強性能和高精度引起業(yè)界關(guān)注。英特爾® Gaudi 2D AI加速器現(xiàn)已針對該模型進行優(yōu)化,這使得AI開發(fā)者能夠以更低成本、更高效率實現(xiàn)復雜任務(wù)的部署與優(yōu)化,有效滿足行業(yè)應用對于推理算力的需求,為AI應用的落地和規(guī)?;l(fā)展提供強有力的支持。

更低成本、更高效率:英特爾Gaudi 2D面向DeepSeek優(yōu)化

作為一款創(chuàng)新性的AIGC模型,DeepSeek Janus模型集成了多模態(tài)理解和生成功能。該模型首次采用統(tǒng)一的Transformer架構(gòu),突破了傳統(tǒng)AIGC模型依賴多路徑視覺編碼的限制,實現(xiàn)了理解與生成任務(wù)的一體化支持。在此基礎(chǔ)上,Janus Pro通過優(yōu)化訓練策略和擴展模型規(guī)模,顯著提升了文生圖等功能的性能與穩(wěn)定性,并提供了10億參數(shù)和70億參數(shù)兩個版本,在性能與精度上展現(xiàn)了較強的競爭力。

更低成本、更高效率:英特爾Gaudi 2D面向DeepSeek優(yōu)化

圖片來源:http://www.ygpos.cn/uploadfile/pic2020/2025/0201/2025020122001821G>

在Janus Pro統(tǒng)一的Transformer架構(gòu)下,文生圖模型的吞吐量高低已經(jīng)從依賴加速器的高算力向充分利用HBM內(nèi)存高帶寬和大容量轉(zhuǎn)換。英特爾® Gaudi2D憑借 2.45TB/秒的高帶寬和 96GB HBM 大容量內(nèi)存,為 Janus Pro 模型提供了強大的計算支持,使其在生圖批處理任務(wù)中,隨著批量大小(Batch Size)的增加,吞吐性能得到顯著提升,大幅縮短任務(wù)處理時間。

與此同時,結(jié)合英特爾Optimum-Habana 框架的優(yōu)化,英特爾® Gaudi2D顯著提升了文生圖任務(wù)的吞吐性能和推理效率,僅需約 10 秒即可生成16張高質(zhì)量的圖片,性能表現(xiàn)卓越。而且,開發(fā)者僅需調(diào)整數(shù)行代碼,即可實現(xiàn)這一結(jié)果,極大降低了開發(fā)門檻和遷移成本,為 AI 應用的高效部署提供便利。

更低成本、更高效率:英特爾Gaudi 2D面向DeepSeek優(yōu)化

圖片來源:利用英特爾Gaudi 2D AI加速器運行DeepSeek Janus-Pro-7B模型生成

此外,DeepSeek的蒸餾模型在至強和Gaudi平臺上也得到了支持,能夠為客戶創(chuàng)造更好的總體擁有成本(TCO),推動AI的普惠。

一直以來,英特爾始終秉承開放的態(tài)度,并通過軟硬件相結(jié)合的方式推動AI應用落地。目前,英特爾豐富的AI產(chǎn)品組合,包括英特爾®至強®處理器、英特爾®GaudiAI加速器、英特爾®酷睿™ Ultra處理器和英特爾銳炫™顯卡等,已經(jīng)針對業(yè)界超過500個開源AI模型提供支持,廣泛涵蓋DeepSeek、Llama 3.1和通義千問等。同時,英特爾深耕開放生態(tài),不僅以開放生態(tài)系統(tǒng)軟件實現(xiàn)針對性優(yōu)化,也通過打造企業(yè)AI開放平臺(OPEA)為這些模型提供支持。

關(guān)于英特爾

英特爾(NASDAQ: INTC)作為行業(yè)引領(lǐng)者,創(chuàng)造改變世界的技術(shù),推動全球進步并讓生活豐富多彩。在摩爾定律的啟迪下,我們不斷致力于推進半導體設(shè)計與制造,幫助我們的客戶應對最重大的挑戰(zhàn)。通過將智能融入云、網(wǎng)絡(luò)、邊緣和各種計算設(shè)備,我們釋放數(shù)據(jù)潛能,助力商業(yè)和社會變得更美好。如需了解英特爾創(chuàng)新的更多信息,請訪問英特爾中國新聞中心intel.cn/content/www/cn/zh/newsroom以及官方網(wǎng)站intel.cn。

©英特爾公司,英特爾、英特爾logo及其它英特爾標識,是英特爾公司或其分支機構(gòu)的商標。文中涉及的其它名稱及品牌屬于各自所有者資產(chǎn)。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )