作者:Jeff Wittich,Ampere Computing 首席產(chǎn)品官
隨著 IT 領(lǐng)域的持續(xù)演變,新的趨勢正在涌現(xiàn)并有望在 2025 年重塑企業(yè)對待技術(shù)的方式。從生成式 AI 到數(shù)據(jù)主權(quán),未來一年各行各業(yè)都將面臨重新思考其戰(zhàn)略以適應(yīng)新變化的挑戰(zhàn)?;陉P(guān)鍵觀察與行業(yè)信號, 以下是 Ampere 對 2025 年做出的四大預(yù)測。
趨勢一:從實驗到執(zhí)行:生成式AI 推理成為焦點
生成式 AI 正在從單純的實驗性工具轉(zhuǎn)變?yōu)槟軌蛱峁┚薮笊虡I(yè)價值的全面集成解決方案。雖然在過去一年中,生成式 AI 的應(yīng)用主要集中在基于公共數(shù)據(jù)的聊天機器人上,但未來的重點是將其應(yīng)用于私密、安全的數(shù)據(jù)集,以創(chuàng)建更具價值的工具。金融、保險和電子商務(wù)等行業(yè)的企業(yè)正準(zhǔn)備采用這些技術(shù),從專有數(shù)據(jù)中提取有價值的見解。
部署靈活性將至關(guān)重要。隨著 AI 工作負(fù)載擴展到各種環(huán)境——包括本地部署、邊緣和氣隙(air-gapped)隔離托管設(shè)施——對延遲敏感的應(yīng)用程序?qū)⒁蠡A(chǔ)設(shè)施更接近用戶,部署在現(xiàn)有數(shù)據(jù)中心和接入點(PoPs)中。此外,推理不再是一個獨立的工作負(fù)載。支持檢索增強生成(RAG)和應(yīng)用集成等任務(wù)將需要強大的通用計算與 AI 專用資源相結(jié)合,同時強調(diào)效率與可擴展性。
趨勢二:推動未來發(fā)展:可再生能源增長疊加效率提升
隨著計算需求的激增,電力需求也在快速增加。然而,電網(wǎng)過載與地域性電力限制正迫使各行業(yè)尋求新的解決方案。隨著小型、區(qū)域分布式數(shù)據(jù)中心的出現(xiàn),太陽能、風(fēng)能和地?zé)岬瓤稍偕茉粗饾u受到青睞。這些項目的發(fā)展需要更長的時間,才能滿足 IT 基礎(chǔ)設(shè)施增長的即時需求。
然而,效率的提升刻不容緩。為了避免短期內(nèi)采用新型不可再生能源或延長其使用壽命,硬件優(yōu)化將在減少電力需求方面發(fā)揮關(guān)鍵作用。用現(xiàn)代高效的處理器替代老舊的高能耗系統(tǒng),可以大幅降低能耗,使現(xiàn)有基礎(chǔ)設(shè)施更具可持續(xù)性。這種效率轉(zhuǎn)變對于在增加能源需求和兼顧環(huán)境管理責(zé)任之間取得平衡至關(guān)重要。
趨勢三:密度增長:充分釋放每個機架與數(shù)據(jù)中心的潛能
鑒于 AI 計算需求的快速增長,大規(guī)模密度已成為計算效率的新基準(zhǔn)。解決方案的構(gòu)建不再局限于節(jié)點層面,而是擴展到了機架和數(shù)據(jù)中心層面。這意味著企業(yè)正在通過充分利用現(xiàn)有硬件來最大化每個機架的工作負(fù)載。與因效率低下而常常導(dǎo)致資源利用不足的傳統(tǒng)系統(tǒng)不同,現(xiàn)代架構(gòu)設(shè)計旨在消除浪費,并提高機架和數(shù)據(jù)中心規(guī)模上的平均利用率,同時避免不可預(yù)測性帶來的負(fù)面影響。
在解決方案層面,密度優(yōu)化的挑戰(zhàn)不僅局限于 AI 專用(AI-only)工作負(fù)載。某些 AI 工作負(fù)載,特別是推理型工作負(fù)載,正在推動基礎(chǔ)設(shè)施變革以適應(yīng)混合用途環(huán)境,而通用計算密度也同樣重要。在軟件工程組織中,更高效的虛擬化和容器化技術(shù)結(jié)合更高效的容器和 PAC(power aware coding)實踐,將實現(xiàn)更好的資源劃分,使企業(yè)能夠在不犧牲性能的情況下實現(xiàn)更高的利用率。
趨勢四:主權(quán)與安全:企業(yè)級AI 崛起
數(shù)據(jù)主權(quán)與安全將在 2025 年對 AI 部署策略產(chǎn)生重要影響。企業(yè)越來越多的認(rèn)識到專有數(shù)據(jù)集的價值,并將其視為具有競爭力的資產(chǎn)。這一轉(zhuǎn)變意味著,AI 推理工作負(fù)載不僅將在超大規(guī)模的公有云上運行,還會在更安全的環(huán)境中運行,如私有云、本地數(shù)據(jù)中心或私有托管設(shè)施。
數(shù)據(jù)泄露和 AI 算法篡改的風(fēng)險凸顯了對安全、隔離基礎(chǔ)設(shè)施的需求。隨著企業(yè)在 AI 驅(qū)動創(chuàng)新領(lǐng)域展開競爭,保護(hù)知識產(chǎn)權(quán)和敏感信息的能力將成為成功的關(guān)鍵。此外,這一趨勢還將擴大企業(yè)自有計算資源的作用,創(chuàng)建一個更加分散和安全的 AI 生態(tài)系統(tǒng)。這種主權(quán)和安全需求,再加上需要將計算資源放在更靠近用戶的地方,將分散計算資源,并催生計算量更大的邊緣架構(gòu)。
###
關(guān)于Ampere Computing
Ampere Computing 是一家現(xiàn)代化半導(dǎo)體企業(yè),致力于塑造云計算的未來,并推出了世界上首款云原生處理器。為可持續(xù)云而生,Ampere 云原生處理器兼具最高性能和最佳每瓦性能,助力加速多種云計算應(yīng)用的交付,為云提供行業(yè)領(lǐng)先的性能、能效和可擴展性。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )