AIGC掀算力需求革命,邊緣計算將不再“邊緣”

科技云報道原創(chuàng)。

隨著以大模型為代表的AIGC時代拉開序幕,算力需求持續(xù)爆發(fā),AI與邊緣深度融合已是大勢所趨,越來越多的企業(yè)開始積極布局GenAI

GenAI技術(shù)的商用化部署和應(yīng)用成為企業(yè)競逐的新陣地,勾勒出大模型從“技術(shù)力”轉(zhuǎn)向“生產(chǎn)力”的新生態(tài)。

算力就是生產(chǎn)力,更豐富的算力資源成為人工智能競爭的核心基石。

IDC預(yù)計,全球AI計算市場規(guī)模將從2022年的195億美元增長到2026年的346.6億美元,其中GenAI計算市場規(guī)模將從2022年的8.2億美元增長到2026年的109.9億美元。

GenAI計算占整體AI計算市場的比例將從4.2%增長到31.7%。

AI算力瓶頸下邊緣計算崛起

隨著AI大模型爆發(fā),大模型迭代和訓(xùn)練所需的算力呈指數(shù)級增長。同時,單個AI超算規(guī)模也受到功耗、土地、散熱等因素制約,算力供給與需求的缺口持續(xù)放大。

此前,ChatGPT官網(wǎng)一度停止Plus付費項目的購買,GPT-4推出之后也已多次下調(diào)付費用戶訪問限制,原因是訪問量激增超出了服務(wù)器的承受能力。

隨著這場GenAI熱潮逐步擴(kuò)張,算力短缺已成為行業(yè)面臨的共同挑戰(zhàn)。

如果說傳統(tǒng)算力是AI大模型的筋骨,那么邊緣算力就是遍布全身的神經(jīng)系統(tǒng)。

英偉達(dá)指出,為了有效運用算力達(dá)成AI應(yīng)用目標(biāo),大規(guī)模數(shù)據(jù)中心勢必要增加資本支出以擴(kuò)大云端運算效能,同時也將帶動邊緣設(shè)備的銷售。

在AI向?qū)嶋H場景落地的過程中,邊緣算力的重要性將加速凸顯。未來的AI運算將呈現(xiàn)出“訓(xùn)練與迭代在云端、推理與內(nèi)容生產(chǎn)梯度分布(云側(cè)+霧側(cè)+邊緣側(cè))”的格局變化,邊緣算力有望成為AI算力的重要組成部分。

相較于傳統(tǒng)云端,邊緣計算作為一種分布式計算架構(gòu),具有低延遲、高安全性、高可靠性、保護(hù)用戶隱私等優(yōu)勢,其在實時決策在自動駕駛、醫(yī)療保健、金融、制造等各個領(lǐng)域都至關(guān)重要。

從效率方面看,邊緣計算使GenAI模型能夠在邊緣處理數(shù)據(jù),從而顯著減少延遲并實現(xiàn)更快洞察。這意味著可以實時做出關(guān)鍵決策,從而提高運營效率、增強(qiáng)客戶體驗和更好的整體業(yè)務(wù)成果。

其次,通過利用邊緣計算,企業(yè)可以在邊緣設(shè)備網(wǎng)絡(luò)上分配計算負(fù)載,從而優(yōu)化資源利用率并有效擴(kuò)展。這種方法最大限度地減少了集中式云基礎(chǔ)設(shè)施的壓力并優(yōu)化了帶寬使用,從而節(jié)省了成本并提高了性能。

第三,通過邊緣計算,GenAI模型可以直接在邊緣設(shè)備或本地服務(wù)器上運行,最大限度地減少將敏感數(shù)據(jù)傳輸?shù)郊惺皆品?wù)器的需要。

通過使數(shù)據(jù)更接近其來源,公司可以顯著降低與數(shù)據(jù)泄露、未經(jīng)授權(quán)的訪問和合規(guī)性問題相關(guān)的風(fēng)險。

從關(guān)系上看,邊緣計算并不尋求取代云計算,相反是對其重要的補(bǔ)充。邊緣計算和云之間的協(xié)作可實現(xiàn)混合架構(gòu),最大限度地發(fā)揮兩種范式的優(yōu)勢。

GenAI模型可以利用云的可擴(kuò)展性和存儲功能,同時受益于邊緣設(shè)備的低延遲和本地處理能力。這種融合確保了GenAI采用的多功能且適應(yīng)性強(qiáng)的基礎(chǔ)設(shè)施。

邊緣計算重構(gòu)生產(chǎn)力邊界

隨著企業(yè)開始越來越多地?fù)肀I,邊緣計算和AI的融合擁有改變?nèi)蛐袠I(yè)的巨大潛力。通過利用本地化處理、實時洞察和優(yōu)化的資源利用,可以充分釋放AI的全部潛力,同時保護(hù)敏感數(shù)據(jù)并推動組織進(jìn)入AI時代。

對此,全球科技巨頭開始將目光越來越多地轉(zhuǎn)向這一領(lǐng)域。

比如,華為、高通均推出邊緣AI產(chǎn)品。去年3月,高通中國在安卓手機(jī)上首次演示了模型參數(shù)超過10億的Stable Diffusion;華為于去年7月發(fā)布智慧搜圖功能,該功能通過對模型進(jìn)行小型化處理。

華為與高通一定程度上驗證了高性能邊緣AI的可行性,并且表明通過模型壓縮+聯(lián)網(wǎng)智能的方式有望在邊緣端實現(xiàn)AI大模型的體驗。

此外,英偉達(dá)黃仁勛也表示,人工智能的下一個浪潮將是具身智能。具身智能能夠在物理世界中進(jìn)行操作和感知,輸出各種機(jī)械動作。

具身智能將邊緣算力需求提升到了一個新高度,具身智能的“大腦”不僅要處理視覺信息、生成提示詞,更要負(fù)責(zé)輸出指令來執(zhí)行機(jī)械動作。在移動芯片無法滿足所需算力的場景下,邊緣IDC將是算力的有效補(bǔ)充措施。

AIPC、AI手機(jī)、具身智能、自動駕駛等AI新應(yīng)用的興起,無疑為邊緣云市場帶來了巨大影響,這種影響既體現(xiàn)在市場規(guī)模的擴(kuò)張,也反映在技術(shù)要求的提升方面。

AIPC、AI手機(jī)作為AI普惠的終端,其本質(zhì)在于云端與本地端的混合協(xié)作,通過利用云端的大數(shù)據(jù)處理能力來豐富本地設(shè)備的使用場景。

這種混合協(xié)作模式對云計算的性能和穩(wěn)定性提出了更高的要求,同時也為云計算帶來了更多的數(shù)據(jù)處理和存儲需求。

邊緣云作為離用戶最近的數(shù)據(jù)處理中心,能夠迅速響應(yīng)這些需求,提供低延遲、高帶寬的數(shù)據(jù)處理服務(wù)。

具身智能和自動駕駛的發(fā)展,更是推動了邊緣云市場的快速增長。智能機(jī)器人需要在真實的物理環(huán)境下執(zhí)行各種任務(wù),這就需要邊緣云提供強(qiáng)大的實時計算能力和數(shù)據(jù)交互能力。

不僅如此,邊緣AI應(yīng)用場景仍在持續(xù)豐富。邊緣云服務(wù)提供商Zenlayer技術(shù)專家表示,對于實時性要求極高的應(yīng)用,如自動駕駛和智能制造,邊緣計算能夠提供毫秒級的低延遲響應(yīng)。

通過在車輛或生產(chǎn)線上部署邊緣計算節(jié)點,客戶可以實時處理傳感器數(shù)據(jù),進(jìn)行決策和控制,從而確保安全和高效的生產(chǎn)運行。

其次,對于需要處理大量數(shù)據(jù)的應(yīng)用,如智能視頻監(jiān)控和智慧城市,邊緣計算能夠減輕中心云的壓力,實現(xiàn)數(shù)據(jù)的本地化處理。

通過在攝像頭或傳感器附近部署邊緣計算設(shè)備,可以對視頻流進(jìn)行實時分析,識別異常事件,并及時進(jìn)行響應(yīng)。

此外,邊緣計算還能夠解決大模型在數(shù)據(jù)傳輸和隱私保護(hù)方面的問題。通過將模型推理過程放在邊緣端進(jìn)行,可以減少數(shù)據(jù)傳輸量,降低網(wǎng)絡(luò)帶寬要求,同時保護(hù)用戶數(shù)據(jù)的隱私和安全。

事實上,目前已有企業(yè)開始探索邊緣計算在AI大模型中的應(yīng)用。

據(jù)Zenlayer技術(shù)專家介紹,某家專注于大模型技術(shù)的初創(chuàng)企業(yè)基于Zenlayer提供的一整套SDN解決方案,通過智能路由和數(shù)據(jù)傳輸協(xié)議優(yōu)化等手段,搭建了一條高效穩(wěn)定的數(shù)據(jù)傳輸通道,確保大模型在訓(xùn)練、推理等關(guān)鍵環(huán)節(jié)都能獲得及時、準(zhǔn)確的數(shù)據(jù)支持,從而顯著提升了模型的應(yīng)用效果和用戶體驗。

此外,還有對于一些AI大模型客戶希望將算力資源部署至海外,Zenlayer針對這類需求,提供了算力托管或算力租賃服務(wù),將計算資源部署在靠近用戶的邊緣數(shù)據(jù)中心,使大模型推理能夠在本地進(jìn)行,極大地降低了數(shù)據(jù)傳輸?shù)难舆t和成本。

同時,Zenlayer還為客戶提供了一系列數(shù)據(jù)本地存儲和傳輸方案,在滿足各個國家對數(shù)據(jù)合規(guī)要求的同時,盡量優(yōu)化業(yè)務(wù)交互體驗。

結(jié)語

如果把視線放得更長遠(yuǎn),在AI等眾多顛覆性技術(shù)的背后,總離不開邊緣計算的存在。當(dāng)全球都沸騰在AIGC的風(fēng)潮里,邊緣云服務(wù)商正通過邊緣端和云邊的融合協(xié)同,滿足更多元的AI應(yīng)用場景,以更自如的算力,讓AI技術(shù)更自如地普惠。

【關(guān)于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-04-24
AIGC掀算力需求革命,邊緣計算將不再“邊緣”
科技云報道原創(chuàng)。隨著以大模型為代表的AIGC時代拉開序幕,算力需求持續(xù)爆發(fā),AI與邊緣深度融合已是大勢所趨,越來越多的企業(yè)開始積極布局Ge...

長按掃碼 閱讀全文