高浩:華為云MVP,南京航空航天大學碩士畢業(yè),曾就職于某研究所集團公司。先后從事大數(shù)據(jù)開發(fā)與數(shù)據(jù)挖掘工作,擅長機器學習和數(shù)據(jù)分析?,F(xiàn)任江蘇知途教育科技有限公司人工智能課程研發(fā)負責人,“1+X” 計算機視覺應(yīng)用開發(fā)認證(初級,中級)副主編,高級認證講師。
從人工智能被寫入政府工作報告,到如今高校遍地開花的人工智能專業(yè),AI作為下一階段科學變革浪潮的新引擎,正在滲透到各行各業(yè),當行業(yè)進入高速發(fā)展期,市場對高端人才的需求和依賴性也隨之攀升。
高浩一直從事大數(shù)據(jù)開發(fā)與數(shù)據(jù)挖掘工作,擅長機器學習和數(shù)據(jù)分析,現(xiàn)在擔任江蘇某教育科技公司的人工智能課程研發(fā)負責人。
在他看來,大量的數(shù)字藍領(lǐng)人才和AI應(yīng)用開發(fā)人員構(gòu)成了當前AI行業(yè)發(fā)展人才之基,這也為高校學生就業(yè)初期從事的工作指明了方向,而華為云ModelArts平臺在教育領(lǐng)域有著天然的數(shù)據(jù)、算法優(yōu)勢,非常適合AI教學。
為什么選擇ModelArts?
AI應(yīng)用的開發(fā)非常復(fù)雜,主要體現(xiàn)在開發(fā)流程冗長、煩瑣,包括數(shù)據(jù)準備、算法開發(fā)、模型開發(fā)、應(yīng)用生成、部署和維護等多個環(huán)節(jié),鏈路很長,每個環(huán)節(jié)都需要大量人力和計算資源的投入。
AI開發(fā)需要的實驗環(huán)境或者平臺資源昂貴,傳統(tǒng)的實踐教學體系與市場崗位、企業(yè)項目脫、產(chǎn)業(yè)發(fā)展、以及個人職業(yè)發(fā)展脫節(jié)。
除此之外,AI的三個關(guān)鍵要素:算法、算力和數(shù)據(jù),一方面推動了AI技術(shù)的應(yīng)用落地,但也提高了學習上手的門檻。
考慮到這些難題,高浩在調(diào)研了多家廠商的開發(fā)平臺后,最終選擇了一站式AI開發(fā)平臺ModelArts。“算法可以采用平臺中已有的通用算法,縮短建立時間,降低技術(shù)人員的入門門檻。算力可以根據(jù)按需方式租用GPU服務(wù)器,降低研究的前期投入。”
高浩表示,ModelArts的教學指南非常完整,它系統(tǒng)地介紹了AI應(yīng)用開發(fā)全流程及其子流程,包括數(shù)據(jù)準備、算法選擇和開發(fā)、模型訓練、評估和調(diào)優(yōu)等,以及人工智能應(yīng)用開發(fā)場景化實踐。
通過一整套工具鏈和方法傳遞,每個開發(fā)者都可以借助ModelArts在具體業(yè)務(wù)場景下更快、更高效、更低成本地開發(fā)AI應(yīng)用,從而更好地解決實際問題。高浩認為,這樣從教學實施角度上也更有普適指導意義。
為了進一步闡釋ModelArts的易用性,高浩詳細演示了一個基于ModelArts和HiLens的云、邊、端協(xié)同的AI應(yīng)用開發(fā)案例。
快速上手ModelArts
ModelArts 的“一站式”體現(xiàn)在它囊括了AI開發(fā)的各個環(huán)節(jié),包括數(shù)據(jù)處理、算法開發(fā)、模型訓練、模型部署等等,而且面向不同經(jīng)驗的開發(fā)者,提供相匹配的使用流程。
內(nèi)容方面,ModelArts支持圖像分類、圖像檢測、視頻分析、語音識別、產(chǎn)品推薦、異常檢測等多種AI應(yīng)用場景。功能方面,它支持從數(shù)據(jù)處理到算法開發(fā)、訓練、部署、開發(fā)流程管理等多種功能。如下圖所示:
其中,核心部分主要包括數(shù)據(jù)處理和模型的管理。
1、數(shù)據(jù)的處理
在ModelArts中,我們都是以數(shù)據(jù)集為數(shù)據(jù)基礎(chǔ),進行模型開發(fā)或訓練等操作的。創(chuàng)建數(shù)據(jù)集前需要獲取訪問OBS的權(quán)限。
目前,ModelArts支持如下9種類型的數(shù)據(jù)集,包含圖片、音頻、文本和其他類別:
圖像分類
物體檢測
聲音分類
語音內(nèi)容
語音分割
文本分類
命名實體
文本三元組
自由格式
針對創(chuàng)建好的數(shù)據(jù)集,可以執(zhí)行標注數(shù)據(jù)、發(fā)布、版本管理、修改、導入和刪除等操作。
以圖像分類為例,只需要給圖片添加相應(yīng)的標簽即完成標注。物理檢測的話,則需要在圖片中使用標注框來框出標注對象,并打上標簽,其余與圖像分類相似。
此處強調(diào)一下命名實體數(shù)據(jù)集,命名實體場景是針對文本中的實體片段進行標注,如“時間”、“地點”等。與文本分類不同的是,它需對片段進行標注,而不是全文。
文本三元組標注則適用于標注語句當中形如(主語/Subject,謂詞/Predicate,賓語/Object)結(jié)構(gòu)化知識的場景,標注時不但可以標注出語句當中的實體,還可以標注出實體之間的關(guān)系,其在依存句法分析、信息抽取等自然語言處理任務(wù)中經(jīng)常用到。
聲音方面,主要是根據(jù)播放內(nèi)容,在 “語音內(nèi)容”文本框中填寫音頻內(nèi)容,完成標注。
2、模型訓練管理
數(shù)據(jù)處理完成后,接下來就是模型的訓練。ModelArts可以基于不同的數(shù)據(jù)選擇不同規(guī)格的資源池(CPU或GPU),根據(jù)用戶選擇的數(shù)據(jù)量和資源不同,模型訓練通常耗時幾分鐘到幾十分鐘不等。
同時,ModelArts也支持查看模型訓練的情況并及時調(diào)整模型參數(shù)。
除支持用戶自己開發(fā)的模型外,ModelArts還提供了AI市場算法,開發(fā)者能直接使用已有的算法,再通過簡單的調(diào)參得到一個滿意的模型。
模型訓練之后,ModelArts模型管理可導入所有訓練版本生成的模型,統(tǒng)一管理迭代和調(diào)試的模型,同時它還支持從模板、容器鏡像以及OBS等場景導入模型,方便模型的部署上線。
另外,ModelArts提供了模型轉(zhuǎn)換功能,可以將已有的模型轉(zhuǎn)換成所需格式,以便應(yīng)用于算力和性能更高的芯片上。舉個例子,用Tensorflow框架訓練的模型,使用轉(zhuǎn)換功能可轉(zhuǎn)換成om格式,即可在昇騰芯片上部署運行。
端側(cè)看HiLens,讓AI應(yīng)用快速落地
學會用ModelArts做好模型訓練后,端側(cè)的開發(fā)平臺HiLens可以讓AI應(yīng)用落地更簡單,高浩也談了談他使用HiLens的感受。
HiLens是端云協(xié)同多模態(tài)AI開發(fā)應(yīng)用平臺,它提供簡單易用的開發(fā)框架、開箱即用的開發(fā)環(huán)境、豐富的AI技能市場和云上管理平臺,對接多種端側(cè)計算設(shè)備如HiLens Kit,支持視覺及聽覺AI應(yīng)用開發(fā)、AI應(yīng)用在線部署、海量設(shè)備管理等。
高浩表示,購買HiLens Kit的普通用戶如果需要快速安裝技能到設(shè)備,使其具備AI能力,可以到技能市場購買技能,基本流程如下:
對于具備編程能力的用戶,也可以選擇自己創(chuàng)建技能。
購買或者創(chuàng)建好技能后,就是對其進行部署,具體可以前往數(shù)據(jù)管理查看技能效果。
基于HiLens,高浩準備開發(fā)了一個檢測施工現(xiàn)場作業(yè)人員是否佩戴安全帽的應(yīng)用。
他在創(chuàng)建好相對應(yīng)的技能后,使用HDMI視頻線連接HiLens Kit視頻輸出端口和顯示器,然后點擊后臺管理中的啟動技能,當狀態(tài)變?yōu)?ldquo;運行中”,表明技能成功運行在端側(cè)設(shè)備上。
最后應(yīng)用的結(jié)果如下:
總的來說,開發(fā)這樣一個檢測工地施工安全的應(yīng)用其實很簡單,先用云端的ModelArts進行數(shù)據(jù)處理和模型訓練,然后再借助HiLens將模型部署到端側(cè),最后就能得到一個可以落地的AI應(yīng)用。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )