AI和ML:數(shù)據(jù)中心的新前沿創(chuàng)新和優(yōu)化

AI和ML:數(shù)據(jù)中心的新前沿創(chuàng)新和優(yōu)化

隨著對數(shù)據(jù)處理和存儲的需求持續(xù)激增,數(shù)據(jù)中心正在努力應對不斷發(fā)展和擴展的挑戰(zhàn)。平臺、設備設計、拓撲結(jié)構(gòu)、功率密度要求和冷卻需求的不斷變化都強調(diào)了對新結(jié)構(gòu)設計的迫切需求。

數(shù)據(jù)中心基礎設施通常難以將當前和預計的IT負載與其關(guān)鍵基礎設施保持一致,從而導致不匹配,威脅到它們滿足不斷升級的需求的能力。在此背景下,必須修改傳統(tǒng)的數(shù)據(jù)中心方法。

數(shù)據(jù)中心現(xiàn)在正在將人工智能(AI)和機器學習(ML)技術(shù)集成到其基礎架構(gòu)中,以保持競爭力。通過在傳統(tǒng)數(shù)據(jù)中心架構(gòu)中實施人工智能驅(qū)動層,企業(yè)可以創(chuàng)建自主數(shù)據(jù)中心,無需人工干預即可優(yōu)化和執(zhí)行通用數(shù)據(jù)工程任務。

使用AI推動傳統(tǒng)架構(gòu)

近年來,數(shù)據(jù)中心內(nèi)AI和ML技術(shù)的激增引人注目。人工智能正在推動各種用例的效率和性能。

Nisum執(zhí)行副總裁Sajid Mohamedy表示,人工智能驅(qū)動的數(shù)據(jù)中心可以通過優(yōu)化應用性能和可用性幫助組織獲得競爭優(yōu)勢,這反過來又有助于提高客戶滿意度和忠誠度。將AI添加到組合中有助于優(yōu)化資源分配,從而提高數(shù)據(jù)中心效率并降低成本。”

快速故障檢測和預測、根本原因分析、電力使用優(yōu)化和資源容量分配優(yōu)化,只是部署數(shù)據(jù)和算法驅(qū)動技術(shù),以最大限度提高數(shù)據(jù)中心效率的幾個例子。

隨著中斷變得越來越頻繁和昂貴,將人工智能整合到數(shù)據(jù)中心對于每個數(shù)據(jù)驅(qū)動型企業(yè)來說變得越來越必要。人工智能驅(qū)動的數(shù)據(jù)中心提供了一系列好處,其中最主要的是有可能減少停機時間,并提高整體系統(tǒng)可靠性,最終為組織節(jié)省大量成本。

提高故障檢測和預測能力

KPMG U.S.人工智能負責人Ellen Campana表示,人工智能歷來被用于增強數(shù)據(jù)存儲優(yōu)化、能源利用和可訪問性。然而,近年來,在將AI的效用擴展到故障檢測和預測方面出現(xiàn)了明顯的趨勢,這可以觸發(fā)自我修復機制。

“簡化自動檢測的關(guān)鍵是為AI提供一個了解硬件和軟件操作細節(jié)的窗口,包括網(wǎng)絡流量。如果某個節(jié)點內(nèi)的流量變慢,AI可以檢測到該模式并觸發(fā)進程或整個節(jié)點的重啟?!?/p>

IBM Automation首席技術(shù)官Pratik Gupta認為,AI具有跨越數(shù)據(jù)中心和混合云環(huán)境的變革潛力。通過增強應用中的用戶體驗、簡化操作并使CIO和業(yè)務決策者能夠從一系列數(shù)據(jù)中收集洞察力,人工智能促進了創(chuàng)新和優(yōu)化。

清楚地了解應用資源級別

Gupta表示,IBM預計到2030年數(shù)據(jù)中心的能源消耗將增加12%(或更多),這是由于摩爾定律的到期以及數(shù)據(jù)量、速度和能源密集型工作負載的爆炸式增長。

“簡單地說,人工智能可以減少購買、維護、管理和監(jiān)控的硬件數(shù)量。”

Gupta表示,數(shù)據(jù)中心管理人員必須清楚地了解其組織的應用資源水平,以便靈活地擴展以滿足實時需求。人工智能驅(qū)動的自動化可以在此過程中發(fā)揮關(guān)鍵作用,降低資源擁塞和延遲的風險,同時確保硬件工作負載保持安全并維持性能標準。

例如,IBM的Turbonomic可以自動優(yōu)化應用資源級別并根據(jù)業(yè)務需求進行擴展。

Gupta表示:“這使IT管理人員能夠擁有一個單一的儀表板來監(jiān)督資源水平、實時做出決策并提高效率,因為這確保其應用不會被過度配置。”

最大限度地發(fā)揮AI驅(qū)動的數(shù)據(jù)中心的優(yōu)勢

數(shù)據(jù)中心的AI和ML用例持續(xù)增長,但組織在實施之前必須考慮一些關(guān)鍵因素。雖然預打包的AI和ML解決方案越來越多,但仍然需要超越單個點解決方案的集成。DIY AI部署是可能的,但需要對傳感器進行投資以收集數(shù)據(jù)和專業(yè)知識,以將數(shù)據(jù)轉(zhuǎn)化為可用的見解。

Campana表示:“許多組織選擇實施自己的數(shù)據(jù)中心,正是因為其可以確保數(shù)據(jù)不會與其他人的數(shù)據(jù)匯集在一起,或以其無法控制的方式使用。雖然這是事實,但組織必須承擔維護安全和隱私的責任?!?/p>

有了合適的資源,數(shù)據(jù)中心可以變得更智能、更高效,但實現(xiàn)這一目標需要優(yōu)化規(guī)劃。

Gupta表示:“規(guī)劃應該是實施人工智能驅(qū)動的數(shù)據(jù)中心的關(guān)鍵支柱。成功的部署不會在一夜之間發(fā)生,在推出之前需要大量的迭代和思考。IT領導者需要考慮一些因素,例如了解可以和應該保留哪些硬件,以及需要將哪些工作負載遷移到云端?!?/p>

靈活性至關(guān)重要

人工智能驅(qū)動的數(shù)據(jù)中心成功的關(guān)鍵是采取戰(zhàn)略方法。這意味著確定AI和ML的正確用例,投資必要的基礎設施和工具,并培養(yǎng)熟練的員工團隊,以有效地管理和維護系統(tǒng)。

Gupta表示,企業(yè)經(jīng)常維護龐大的基礎設施,從分布式數(shù)據(jù)中心位置到各種云部署。IT領導者需要考慮是否需要為所有數(shù)據(jù)源構(gòu)建一個聚合湖……或者將數(shù)據(jù)準備、ML和AI工具帶到每個位置。隨著企業(yè)轉(zhuǎn)變其IT基礎設施,不僅必須考慮交付的價值,還要考慮產(chǎn)生的漏洞?!?/p>

其補充道:”最好的計劃也可能會出錯。技術(shù)推廣也是如此,能夠快速調(diào)整路線的靈活組織將更加成功?!?/p>

提高IT和數(shù)據(jù)中心性能的四種新興戰(zhàn)略

AIOps、MLOps、DevOps和SecOps各有其獨特的優(yōu)勢。當結(jié)合后,可以優(yōu)化數(shù)據(jù)中心運營和更廣泛的IT性能,降低成本并實現(xiàn)服務改進。

AIOps自動化和擴展企業(yè)范圍內(nèi)的數(shù)據(jù)中心和IT工作流程

AIOps正在成為企業(yè)在數(shù)據(jù)中心的可持續(xù)發(fā)展和碳減排工作的核心,并已被證明可以有效地識別出現(xiàn)性能差距的原因。該技術(shù)的核心是其能夠根據(jù)實時性能數(shù)據(jù)(因果分析)解釋和建議行動。

例如,Walmart正在使用AIOps來簡化電子商務運營。AIOps依靠ML模型和自然語言處理(NLP)的組合來發(fā)現(xiàn)可以提高數(shù)據(jù)中心運營的準確性、成本效益和效率的新流程工作流。零售商還使用AIOps實時檢測和解決低效和不連貫的流程,同時實現(xiàn)技術(shù)堆棧自動化和更廣泛的基礎設施管理。

AIOps可在電子商務平臺內(nèi)實現(xiàn)更準確的實時異常檢測。該技術(shù)還擅長關(guān)聯(lián)來自數(shù)據(jù)中心所有可用來源的數(shù)據(jù),以提供360度的運營視圖,并確定可以改進可用性、成本控制和性能的地方。

零售商依靠DevOps來加速應用開發(fā)

零售商依靠DevOps來保持競爭力,并縮短新應用和功能的上市時間。DevOps基于強調(diào)軟件開發(fā)人員和IT運營團隊之間協(xié)作和溝通的軟件開發(fā)方法。其在簡化新移動應用、網(wǎng)站功能和基于客戶體驗的增強的軟件交付和開發(fā)方面被證明是有效的。

Amazon、Target、Nordstrom、Walmart和其他領先的零售商都采用DevOps作為主要軟件開發(fā)流程。零售CIO表示,DevOps代碼庫的質(zhì)量越高,數(shù)據(jù)中心運行的效率就越高,為全球客戶提供最新的應用版本。

MLOps提供了一種基于生命周期的方法

隨著零售商招募更多的數(shù)據(jù)科學家,MLOps變得與DevOps一樣重要,可以保持模型的最新性和可用性。MLOps將DevOps原則應用于ML模型和算法。領先的零售商使用MLOps來設計、測試和發(fā)布新模型,以改進客戶細分、需求預測和庫存管理。

從庫存管理和優(yōu)化開始,MLOps被證明可以有效解決零售業(yè)中成本最高、最具挑戰(zhàn)性的問題。供應鏈的不確定性、長期的勞動力短缺和不斷攀升的通貨膨脹成本,使庫存管理成為零售商成敗的關(guān)鍵。

Macy、Walmart和其他企業(yè)正在使用MLOps來優(yōu)化定價和庫存管理,幫助零售商做出降低成本的決策,并保護自己免受持有過多庫存的下行風險。

SecOps依靠AI和ML來保護每個身份和威脅面

SecOps確保數(shù)據(jù)中心和更廣泛的IT基礎設施保持安全和投訴。零信任安全假設任何用戶或設備都不可信任,并且每個身份都必須經(jīng)過驗證,這是任何成功實施SecOps的基礎。目標是減少日益復雜的網(wǎng)絡攻擊的攻擊面和風險。

SecOps通過結(jié)合最成熟的技術(shù)來減少入侵和破壞,從而優(yōu)化數(shù)據(jù)中心的安全性。采用零信任安全措施有助于零售商保護其客戶、員工和供應商的身份,而微細分可以限制任何攻擊的爆炸半徑。

人工智能和數(shù)據(jù)中心技術(shù)的未來

邊緣計算正在成為開發(fā)人工智能驅(qū)動的數(shù)據(jù)中心最有前途的技術(shù)之一。通過處理更靠近源頭的數(shù)據(jù),邊緣計算減少了延遲,并提高了整體性能。當與人工智能結(jié)合時,該技術(shù)提供了實現(xiàn)實時分析和決策能力的潛力,使數(shù)據(jù)中心能夠處理未來的關(guān)鍵任務程序。

Campana表示:“向5G的轉(zhuǎn)變是這一轉(zhuǎn)型的重要一步,并且正在推動基于人工智能的軟件基礎設施的創(chuàng)新浪潮。對于開始新數(shù)據(jù)中心的企業(yè)來說,值得考慮其采用5G和對終端用戶硬件進行其他更新的時間表?!?/p>

而Gupta以為,數(shù)據(jù)智能自動化是繼續(xù)進入嚴格監(jiān)管行業(yè)的一種方式,因為人工智能和數(shù)據(jù)中心工具將被設計成自動滿足合規(guī)要求。

“隨著人工智能和自動化進一步嵌入數(shù)據(jù)中心,它們將能夠滿足最嚴格的合規(guī)協(xié)議。”

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-14
AI和ML:數(shù)據(jù)中心的新前沿創(chuàng)新和優(yōu)化
隨著對數(shù)據(jù)處理和存儲的需求持續(xù)激增,數(shù)據(jù)中心正在努力應對不斷發(fā)展和擴展的挑戰(zhàn)。平臺、設備設計、拓撲結(jié)構(gòu)、功率密度要求和冷卻需求的不斷變化都強調(diào)了對新結(jié)構(gòu)設計的迫切需求。

長按掃碼 閱讀全文