“未來十年是 AI 的黃金十年”,業(yè)已成為各界共識。無論是硅谷巨頭還是國內(nèi)的華為、騰訊、阿里,都把 AI 視作開啟下一個時代的鑰匙。
作為最為核心的 AI 技術(shù)之一,深度學(xué)習(xí)成為各企業(yè)進(jìn)軍 AI 領(lǐng)域的突破口。 在經(jīng)歷了Caffe、Theano代表的淺層框架時代以及Tensorflow、PyTorch代表的通用框架時代,深度學(xué)習(xí)框架的發(fā)展,迎來了以 MindSpore 為代表的全場景 AI 計算框架的新時代。
MindSpore 是華為推出的深度學(xué)習(xí)框架,具備統(tǒng)一的模型訓(xùn)練、推理和導(dǎo)出等接口,支持端、邊、云等不同場景下的靈活部署。自2020 年 3 月正式開源以來,MindSpore 已經(jīng)培育了一個十分活躍的技術(shù)社區(qū),軟件總下載量超130萬,Star 數(shù)量超1.6萬,PR數(shù)超5.16萬。
風(fēng)口之上,如何將 AI 技術(shù)落地,才是關(guān)鍵。AI 落地,就是要擺脫概念化,就必須找到合適的場景。2021 年 9 月起,MindSpore 社區(qū)開展了“MindSpore 開源活動”,設(shè)計了很多基于實際場景需求的任務(wù)。
比如,在做圖像識別時,載入圖片之后,往往需要對圖片進(jìn)行預(yù)處理,以保證圖像符合預(yù)訓(xùn)練模型的需求,其中一項就是把圖像數(shù)據(jù)由 (H,W,C)的矩陣轉(zhuǎn)換為(C,H,W)。MindSpore 現(xiàn)有的轉(zhuǎn)換算子,只能輸入三通道數(shù)的圖片,Gitee @unseenme 僅用了幾天時間就實現(xiàn)了多通道圖像輸入。這很有必要。在常規(guī)圖像處理以外的領(lǐng)域,如醫(yī)學(xué)圖像處理,其包含圖像的通道數(shù)可能達(dá)到了1000,因為醫(yī)療圖像中每一層可以看成是一個切片,整張圖片包含很多的切片。
自“MindSpore 開源活動”啟動以來,已經(jīng)提交了數(shù)十個 PR,其中近一半已經(jīng)被合并。
其中一個 PR 與腦瘤識別有關(guān)。數(shù)據(jù)集是 2800 多張腦影像圖片,分為 no_tumor(無腫瘤)、glioma_tumor(膠質(zhì)瘤)、meningioma_tumor(腦膜瘤)、pituitary_tumor(垂體瘤)四類訓(xùn)練集。由于圖片數(shù)量較少,且各類腦瘤對于非專業(yè)的醫(yī)學(xué)人士而言難以分辨,因此任務(wù)難度很高。不過,Gitee @liyu_sup 基于卷積神經(jīng)網(wǎng)絡(luò)以及深度殘差網(wǎng)絡(luò),很快就建立了腦瘤識別的 baseline 模型,并且將代碼貢獻(xiàn)給了 MindSpore 社區(qū)。
事實上,隨著深度學(xué)習(xí)的快速發(fā)展,越來越多的研究者都在嘗試將深度學(xué)習(xí)技術(shù)引入到腫瘤檢測項目中。基于人工提取特征的檢測算法,不僅需要專業(yè)領(lǐng)域的知識 ,而且耗時費力,并且最后還不一定能提取高質(zhì)量特征,而利用深度學(xué)習(xí)建立模型則完美解決了這些問題。
MindSpore 合并的 PR,大部分能夠應(yīng)用在實際的場景中,最大化地將個人智慧產(chǎn)生社會影響力,真正實現(xiàn)技術(shù)的落地。
在 AI 落地行業(yè)時,最大的挑戰(zhàn)是如何降低開發(fā)門檻,并提供泛化能力,解決小樣本、跨模態(tài)等關(guān)鍵技術(shù)。
因此,MindSpore 在不遺余力地引導(dǎo)更多開發(fā)者關(guān)注、學(xué)習(xí) AI 技術(shù)。MindSpore 提供了詳細(xì)的教程,包括訓(xùn)練、推理和端側(cè)設(shè)備使用三部分,開發(fā)者可以根據(jù)自身情況選擇不同階段進(jìn)行學(xué)習(xí)。教程設(shè)置由易到難,步步深入,從深度學(xué)習(xí)的發(fā)展歷史,到MindSpore 的安裝及使用,到深度學(xué)習(xí)算法、自然語言處理、圖像識別等多種AI實戰(zhàn),再到MindSpore 的原理及創(chuàng)新算法均有涉及,甚至還會補充深度學(xué)習(xí)、機(jī)器學(xué)習(xí)基礎(chǔ)知識。
千里之行,始于足下。學(xué)習(xí)最有效的方式,就是與實踐相結(jié)合。這也是“MindSpore 開源活動”出現(xiàn)的原因。簡單來說,就是開發(fā)者先學(xué)習(xí)官方視頻課程,然后動手實踐任務(wù),任務(wù)完成后經(jīng)由技術(shù)人員指導(dǎo)審核通過即可。
MindSpore 社區(qū)設(shè)置了初、中、高三個難度級別任務(wù),包括文檔資料、語法規(guī)范、技術(shù)文章、框架 bug、API 補齊、模型開發(fā)、模型遷移、論文復(fù)現(xiàn)、算子開發(fā)、應(yīng)用案例等 10 種任務(wù)類型。對開源新手來說,可以先做一些簡單的任務(wù),比如在代碼中為函數(shù)添加注釋,將中文說明文檔翻譯成英文。
完成任務(wù)后,可獲得相應(yīng)積分,憑借積分可兌換價值300元-4500元的獎品,并獲得開發(fā)者證書。此外,優(yōu)秀開發(fā)者更有機(jī)會成為 MindSpore 開源社區(qū) SIG 組組長,參與到 MindSpore 核心技術(shù)演進(jìn)的討論。
“MindSpore 開源活動”將 MindSpore 學(xué)習(xí)過程與 MindSpore 開源實踐結(jié)合起來,一步步引導(dǎo)開發(fā)者進(jìn)入深度學(xué)習(xí)領(lǐng)域,迅速擴(kuò)展和鍛煉技術(shù)圖譜。此外,以開源的方式貢獻(xiàn)代碼,不是屬于某個人的,也不是某個公司的,而是屬于所有人的。
除了技術(shù)落地之外,人才稀缺也一直是 AI 技術(shù)進(jìn)一步發(fā)展的掣肘。我國AI產(chǎn)業(yè)在短期內(nèi)實現(xiàn)高速增長同時,人才需求面臨巨大缺口,而且 AI 人才的培養(yǎng)明顯滯后。雖然越來越多高校已經(jīng)開設(shè)了深度學(xué)習(xí)、機(jī)器視覺等AI相關(guān)專業(yè),但招生規(guī)模仍然較小,畢業(yè)生數(shù)量遠(yuǎn)遠(yuǎn)無法滿足企業(yè)需求。
《人工智能產(chǎn)業(yè)人才發(fā)展報告(2019-2020年版)》指出,人工智能領(lǐng)域仍然存在人才儲備不足且培養(yǎng)機(jī)制不完善等問題,人才供需比嚴(yán)重不平衡,預(yù)計當(dāng)前我國人工智能產(chǎn)業(yè)內(nèi)有效人才缺口達(dá)30萬。
正是看到這一點,華為早在 2018 年就宣布了沃土 AI開發(fā)者使能計劃。其中,面向高校和科研機(jī)構(gòu),計劃投入10億元人民幣用于AI人才培養(yǎng);在開發(fā)者方面,計劃三年培養(yǎng)100萬開發(fā)者。
此次的“MindSpore 開源活動”,也是官方人才培養(yǎng)計劃的一部分。也許,所謂的開源活動,不過是 MindSpore 拋出的一塊餌,希望能吸引更多的開發(fā)者參與進(jìn)來,一起開創(chuàng)一個 AI 時代。
加入 MindSpore 開源社區(qū),邁向更廣闊領(lǐng)域。歡迎開發(fā)者到Gitee官方網(wǎng)站MindSpore 開源社區(qū)參與活動。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )