模型量化和邊緣人工智能如何定義交互方式

人工智能與邊緣計算的融合承諾為許多行業(yè)帶來變革。模型量化的快速創(chuàng)新在這方面發(fā)揮著關(guān)鍵作用,模型量化是一種通過提高可移植性和減小模型大小來加快計算速度的技術(shù)。

模型量化彌補了邊緣設(shè)備的計算限制與部署高精度模型的需求之間的差距,以實現(xiàn)更快、更高效、更具成本效益的邊緣AI解決方案。廣義訓(xùn)練后量化(GPTQ)、低秩適應(yīng)(LoRA)和量化低秩適應(yīng)(QLoRA)等突破有可能在數(shù)據(jù)生成時促進實時分析和決策。

邊緣人工智能與正確的工具和技術(shù)相結(jié)合,可以重新定義我們與數(shù)據(jù)和數(shù)據(jù)驅(qū)動的應(yīng)用交互的方式。

為什么選擇邊緣人工智能

邊緣人工智能的目的是讓數(shù)據(jù)處理和模型更接近數(shù)據(jù)生成的地方,例如遠程服務(wù)器、平板電腦、物聯(lián)網(wǎng)設(shè)備或智能手機。這可實現(xiàn)低延遲、實時的人工智能。到2025年,超過一半的深度神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析將發(fā)生在邊緣。這種模式的轉(zhuǎn)變將帶來多重優(yōu)勢:

減少延遲:通過直接在設(shè)備上處理數(shù)據(jù),邊緣人工智能減少了與云來回傳輸數(shù)據(jù)的需要。這對于依賴實時數(shù)據(jù)并需要快速響應(yīng)的應(yīng)用至關(guān)重要。

降低成本和復(fù)雜性:在邊緣本地處理數(shù)據(jù)消除了來回發(fā)送信息的昂貴的數(shù)據(jù)傳輸成本。

隱私保護:數(shù)據(jù)保留在設(shè)備上,減少數(shù)據(jù)傳輸和數(shù)據(jù)泄露的安全風(fēng)險。

更好的可擴展性:采用邊緣人工智能的去中心化方法可以更輕松地擴展應(yīng)用,而無需依賴中央服務(wù)器的處理能力。

例如,制造商可以在其流程中實施邊緣人工智能,以進行預(yù)測性維護、質(zhì)量控制和缺陷檢測。通過運行人工智能并在本地分析來自智能機器和傳感器的數(shù)據(jù),制造商可以更好地利用實時數(shù)據(jù)來減少停機時間,并改進生產(chǎn)流程和效率。

模型量化的作用

為了使邊緣人工智能發(fā)揮作用,人工智能模型需要在不影響準確性的情況下優(yōu)化性能。人工智能模型變得越來越復(fù)雜、越來越龐大,使得它們更難處理。這給在邊緣部署人工智能模型帶來了挑戰(zhàn),邊緣設(shè)備通常資源有限,支持此類模型的能力也受到限制。

模型量化降低了模型參數(shù)的數(shù)值精度(例如從32位浮點到8位整數(shù)),使模型輕量化,適合部署在手機、邊緣設(shè)備、嵌入式系統(tǒng)等資源受限的設(shè)備上。

GPTQ、LoRA和QLoRA這三種技術(shù)已經(jīng)成為模型量化領(lǐng)域潛在的游戲規(guī)則改變者:

GPTQ涉及在訓(xùn)練后壓縮模型。它非常適合在內(nèi)存有限的環(huán)境中部署模型。

LoRA涉及微調(diào)大型預(yù)訓(xùn)練模型以進行推理。具體來說,它對構(gòu)成預(yù)訓(xùn)練模型大矩陣的較小矩陣(稱為LoRA適配器)進行微調(diào)。

QLoRA是一種內(nèi)存效率更高的選項,它利用GPU內(nèi)存來進行預(yù)訓(xùn)練模型。當使模型適應(yīng)新任務(wù)或計算資源有限的數(shù)據(jù)集時,LoRA和QLoRA特別有用。

從這些方法中進行選擇在很大程度上取決于項目的獨特需求、項目是否處于微調(diào)階段或部署階段,以及是否擁有可供使用的計算資源。通過使用這些量化技術(shù),開發(fā)人員可以有效地將人工智能帶到邊緣,在性能和效率之間取得平衡,這對于廣泛的應(yīng)用至關(guān)重要。

邊緣人工智能用例和數(shù)據(jù)平臺

邊緣人工智能的應(yīng)用非常廣泛。從處理火車站有軌車檢查圖像的智能相機,到檢測佩戴者生命體征異常的可穿戴健康設(shè)備,再到監(jiān)控零售商貨架上庫存的智能傳感器,可能性是無限的。因此,IDC預(yù)測2028年邊緣計算支出將達到3170億美元,邊緣正在重新定義組織處理數(shù)據(jù)的方式。

隨著組織認識到邊緣人工智能推理的好處,對強大的邊緣推理堆棧和數(shù)據(jù)庫的需求將會激增。此類平臺可以促進本地數(shù)據(jù)處理,同時提供邊緣人工智能的所有優(yōu)勢,從減少延遲到增強數(shù)據(jù)隱私。

為了使邊緣人工智能蓬勃發(fā)展,持久的數(shù)據(jù)層對于本地和基于云的數(shù)據(jù)管理、分發(fā)和處理至關(guān)重要。隨著多模態(tài)人工智能模型的出現(xiàn),能夠處理各種數(shù)據(jù)類型的統(tǒng)一平臺,對于滿足邊緣計算的運營需求變得至關(guān)重要。統(tǒng)一的數(shù)據(jù)平臺使人工智能模型能夠在線上和離線環(huán)境中,無縫訪問本地數(shù)據(jù)存儲并與之交互。此外,分布式推理有望緩解當前的數(shù)據(jù)隱私和合規(guī)性問題。

隨著我們向智能邊緣設(shè)備邁進,人工智能、邊緣計算和邊緣數(shù)據(jù)庫管理的融合將成為預(yù)示快速、實時和安全解決方案時代的核心。展望未來,組織可以專注于實施復(fù)雜的邊緣策略,以高效、安全地管理人工智能工作負載并簡化業(yè)務(wù)中數(shù)據(jù)的使用。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-12-26
模型量化和邊緣人工智能如何定義交互方式
隨著我們向智能邊緣設(shè)備邁進,人工智能、邊緣計算和邊緣數(shù)據(jù)庫管理的融合將成為預(yù)示快速、實時和安全解決方案時代的核心。展望未來,組織可以專注于實施復(fù)雜的邊緣策略,以高效、安全地管理人工智能工作負載并簡化業(yè)務(wù)中數(shù)據(jù)的使用。

長按掃碼 閱讀全文