不信不可能:飛槳,劃一個時代的初心

原標(biāo)題:不信不可能:飛槳,劃一個時代的初心

AI在哪里?

大部分人可能會想到科幻電影,或者異常先進(jìn)的實驗室。但是河北工業(yè)大學(xué)教授劉晶卻認(rèn)為AI就在一間間工廠車間里。學(xué)習(xí)了六年深度學(xué)習(xí),花兩個月時間跑了一百多家鋼鐵廠,最終,她把在鋼鐵熔煉復(fù)雜的配料過程中,老師傅們練就的三十年經(jīng)驗,變成了三秒就能給出最優(yōu)配比的AI模型。

這個模型,每年可以為鋼鐵企業(yè)節(jié)省10%的原材料,把配料計算時間節(jié)省了90%。而她能做到這一切、把不可能化成可能的基礎(chǔ),是應(yīng)用了百度的飛槳平臺。

這一秒鐘,千千萬萬個這樣的故事,正同時上演在中國廣袤的大地上。AI不在別處,AI就在這里,在我們的農(nóng)田、工廠、礦山、辦公室,在萬家燈火渺渺炊煙中。

AI從天邊來到千行萬業(yè)去,從不可能變成可能,就是一段完整的關(guān)于飛槳的故事。

(百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室主任王海峰)

11月5日,“WAVE SUMMIT+”2019深度學(xué)習(xí)開發(fā)者秋季峰會在北京召開,AI開發(fā)者再熟悉不過的、被稱為AI時代操作系統(tǒng)和百度AI底座的飛槳,又一次迎來了大規(guī)模技術(shù)升級。

畢竟還有不到兩個月2019就要結(jié)束,在關(guān)注飛槳狂飆突進(jìn)的速度之外,此時或許有必要回望一下關(guān)于飛槳走過的路,未來的方向,以及不變的初心。

在這些故事、邏輯和蘊(yùn)藏的情感里,我們可以真實地讀懂百度AI,讀懂深度學(xué)習(xí)開發(fā)者,讀懂中國智能時代的黎明。

盛宴:百度AI的彪悍速度

也許我們的讀者都還記得,今年4月,百度曾主辦了首場深度學(xué)習(xí)開發(fā)者峰會。當(dāng)時很多讀者給我們留言,表示飛槳升級的技術(shù)實在太多了,只是讀完都感覺腦子有點(diǎn)跟不上。也有讀者說,別人家都是一場發(fā)布會說一兩個技術(shù),百度是一場發(fā)布會說一打技術(shù)。

到了秋天,我們發(fā)現(xiàn)百度顯然決定在彪悍之路上一條道走到黑。這次的深度學(xué)習(xí)開發(fā)者峰會上,飛槳一口氣發(fā)布和重要升級21個產(chǎn)品方向。沒錯,一打已經(jīng)不夠用了。

峰會現(xiàn)場,不少媒體同行和開發(fā)者表示,技術(shù)實在太多,邊聽邊記都跟不上速度——而百度居然就生猛地把它們一個個做出來了。

會上,百度深度學(xué)習(xí)技術(shù)平臺部總監(jiān)馬艷軍博士,介紹了飛槳產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺全景圖,詳解了飛槳全新發(fā)布的21個產(chǎn)品方向。

其中,十分引入矚目的是,飛槳全新發(fā)布了4大面向應(yīng)用任務(wù)的產(chǎn)業(yè)級端到端開發(fā)套件。包括NLP領(lǐng)域的ERNIE語義理解,CV方向的PaddleDetection目標(biāo)檢測和PaddleSeg圖像分割,推薦方向的ElasticCTR點(diǎn)擊率預(yù)估,在關(guān)鍵產(chǎn)業(yè)應(yīng)用中,滿足低成本和快速集成需求。

而全新發(fā)布的端側(cè)推理引擎Paddle Lite 2.0版本,則進(jìn)一步提升了飛槳在硬件端的易用性和兼容性,具有超高 INT8 量化性能。

此外,飛槳還全新發(fā)布了3項深度學(xué)習(xí)技術(shù)工具組件:聯(lián)邦學(xué)習(xí)PaddleFL、圖神經(jīng)網(wǎng)絡(luò)PGL和多任務(wù)學(xué)習(xí)PALM,從而將最先進(jìn)的技術(shù)帶到產(chǎn)業(yè)實踐中。

EasyDL則發(fā)布了為算法工程師提供一站式解決方案的EasyDL專業(yè)版、PaddleHub 也全新升級,支持遷移學(xué)習(xí)與飛槳Master模式。

飛槳Master,也是本次峰會的一大亮點(diǎn)。這一模式把算力、數(shù)據(jù)、算法集成為產(chǎn)業(yè)級預(yù)訓(xùn)練模型。與大量遷移學(xué)習(xí)工具平臺配合,構(gòu)成了產(chǎn)業(yè)底座,為產(chǎn)業(yè)AI開發(fā)者奠定了全面基礎(chǔ)支撐。

此外,飛槳還進(jìn)行了動態(tài)圖全新升級、新增大量算子庫、優(yōu)化API 接口,技術(shù)文檔更加完善;分布式GPU訓(xùn)練相比其他主流框架實現(xiàn)了20%-100%的速度提升,分布式CPU訓(xùn)練最大吞吐量達(dá)到行業(yè)6倍以上;官方模型從60+增加到了100+,提供預(yù)訓(xùn)練模型超過200個;并且此次新開源了4個國際競賽冠軍模型;同時重磅推出了大量資源、課程、獎勵賦能的飛槳生態(tài)激勵計劃。

對于AI開發(fā)者來說,盛宴,當(dāng)如是也。

初心:飛槳的來處與去處

在飛槳令人眼花繚亂的升級,保持超高速進(jìn)化的背后,或許每個人都會想問這樣一個問題:到底是什么支撐了飛槳的奔跑?他們會一直這樣跑下去嗎?

畢竟這一年里,歐美主流深度學(xué)習(xí)框架的更新頻率并不高,而歐美大型科技公司對AI開發(fā)的技術(shù)升級也多次被批評過于緩慢。

當(dāng)降速的歐美AI,碰上了飛速奔跑的中國AI與飛槳,我們當(dāng)然會興奮,也自然會充滿疑問。百度AI技術(shù)平臺體系執(zhí)行總監(jiān)、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室副主任吳甜,對這個問題的回答是,飛槳的升級動力來自百度AI團(tuán)隊與產(chǎn)業(yè)開發(fā)者的高效頻繁溝通。

今天的飛槳,已經(jīng)深深扎根于產(chǎn)業(yè)環(huán)境和開發(fā)生態(tài)當(dāng)中。來自各個產(chǎn)業(yè)的AI需求、挑戰(zhàn)和瓶頸會隨時反饋給飛槳,開發(fā)者遇到的問題與挑戰(zhàn)會隨時與百度溝通。在這個開放和高效運(yùn)轉(zhuǎn)的空間里,百度的AI科學(xué)家們與產(chǎn)業(yè)開發(fā)者形成了一個整體。開發(fā)者需要什么,飛槳就去做什么;產(chǎn)業(yè)智能化遇到了哪些無法克服的問題,百度就去調(diào)兵遣將解決它。

這樣的模式,是封閉在小環(huán)境中的互聯(lián)網(wǎng)公司所無法完成的,飛槳的奔跑,來自百度對技術(shù)的探索和追尋,同時也來自開發(fā)者和產(chǎn)業(yè)的真實聲音循環(huán)反饋。對此,我們的感觸也十分清晰,記得今年上半年在百度黃埔學(xué)院第一期畢業(yè)禮上,我們與開發(fā)者討論飛槳還有哪些問題。如今半年過去,這些問題真的已經(jīng)被一個個升級所擊破。

其實不管是大規(guī)模分布式訓(xùn)練、全硬件平臺支持、工業(yè)級模型庫,還是幾大領(lǐng)先世界的AI操作系統(tǒng)特性,飛槳的背后,是對一個簡單目標(biāo)的極致化:讓AI開發(fā)具備更高性能、更低門檻。

這是飛槳的初心,而圍繞這個初心的窮思竭慮,變成了飛槳的升級速度和產(chǎn)業(yè)廣度。

圍繞開發(fā)易用性和開發(fā)性能升級,本次飛槳大規(guī)模升級里,有兩個關(guān)鍵點(diǎn)可以作為很好的解讀點(diǎn)。

一個是Master模式的誕生。所謂Master模式,從邏輯上看就是飛槳基于大量產(chǎn)業(yè)實踐,總結(jié)出產(chǎn)業(yè)AI開發(fā)者到底需要哪些數(shù)據(jù)、算法和算力。然后飛槳將其最大公約數(shù)變成預(yù)訓(xùn)練模型。而對于企業(yè)來說,只要在此基礎(chǔ)上進(jìn)行小規(guī)模的數(shù)據(jù)標(biāo)注,就可以省去復(fù)雜模型的研發(fā)成本,以及龐大冗長的訓(xùn)練流程,快速把AI能力結(jié)合到場景應(yīng)用。

這是一個高強(qiáng)度面向產(chǎn)業(yè)實際應(yīng)用的模式。它是百度AI技術(shù)的高度集成和沉淀,同時也來自飛槳對產(chǎn)業(yè)真實應(yīng)用具體而微的理解,必須保證預(yù)訓(xùn)練模型與產(chǎn)業(yè)最大效率接軌。百度一位專家,把Master模式比作飯館做菜時候的那鍋老湯——產(chǎn)業(yè)應(yīng)用者只需要享受一勺下去味美絕倫,而不用等待漫長而復(fù)雜的熬制過程。

再一個就是上面所說,飛槳端到端開發(fā)套件的發(fā)布。今天的情況是,眾多產(chǎn)業(yè)開發(fā)者并不具備深厚的AI功底,但需要迫切能解決問題的AI能力。端到端開發(fā)套件,就可以讓一個只有基礎(chǔ)編程能力的技術(shù)人員,利用套件工具來解決具備主流應(yīng)用性的AI問題。比如語義理解是智能語音相關(guān)AI問題的核心;視覺分割和圖像檢測是機(jī)器視覺能力最大的應(yīng)用需求;CTR推薦具備從互聯(lián)網(wǎng)到實體經(jīng)濟(jì)極其廣泛的應(yīng)用覆蓋度。飛槳把這些套件提前做好,就可以把相應(yīng)問題的AI開發(fā)門檻降到最低程度,產(chǎn)業(yè)可以無縫進(jìn)入AI時代。

這些技術(shù)與產(chǎn)業(yè)智慧的碰撞結(jié)果,是將飛槳打造成了源于產(chǎn)業(yè)實踐,與產(chǎn)業(yè)共進(jìn)的深度學(xué)習(xí)開源開放平臺。而未來,飛槳還會繼續(xù)進(jìn)化,畢竟核心框架的進(jìn)化還在進(jìn)行時、開發(fā)者的需求還有無窮無盡、中國產(chǎn)業(yè)智能化的大門剛剛開啟。

(百度AI技術(shù)平臺體系執(zhí)行總監(jiān)、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室副主任吳甜)

吳甜認(rèn)為,未來飛槳還會持續(xù)發(fā)展超大規(guī)模分布式計算、異構(gòu)計算能力,定位于全硬件平臺支持、端云邊結(jié)合。深度學(xué)習(xí)平臺還要繼續(xù)向前,推進(jìn)核心框架持續(xù)向完美發(fā)展;而飛槳的四大領(lǐng)先特性也會持續(xù)前進(jìn),堅持面向產(chǎn)業(yè)級應(yīng)用,挖掘中國全產(chǎn)業(yè)擁抱AI的可能。

飛槳的去處,歸根結(jié)底是百度AI科學(xué)家們看到了這樣一個機(jī)會:中國擁有最廣泛全面的產(chǎn)業(yè)鏈,而飛槳則提供了當(dāng)今最快的AI基礎(chǔ)設(shè)施進(jìn)化速度。

廣和快的碰撞,往往是奇跡的原點(diǎn)。

承擔(dān):智能時代的中國情懷

很多西方學(xué)者都提出過這樣一個觀點(diǎn):中國的現(xiàn)代化進(jìn)程,尤其是近年的經(jīng)濟(jì)騰飛,堪稱集體主義在人類文明史中完成的奇跡。

中國人的經(jīng)濟(jì)智慧,是調(diào)集力量克服困難,哪怕承擔(dān)一部分犧牲,也要把基礎(chǔ)做好,把起點(diǎn)做扎實。然后在此基礎(chǔ)上建設(shè)產(chǎn)業(yè)、發(fā)展生態(tài),讓智慧的中國人有舞臺騰飛。從互聯(lián)網(wǎng)、通訊、高鐵、城建莫不如此,這也是中國之所以被稱作“基建狂魔”的原因。

AI時代,人類正在悄然抵達(dá)第四次工業(yè)革命的起點(diǎn)。而過往的三次工業(yè)革命,東方更多時候都是看客。這次,中國AI和產(chǎn)業(yè)智能化顯然不想再旁觀和等待了。

那么誰來擔(dān)當(dāng)中國AI時代的“基建狂魔”呢?

自2016年正式開源以來,飛槳是中國首個也是目前國內(nèi)唯一全面開源開放、技術(shù)領(lǐng)先、功能完備的產(chǎn)業(yè)級深度學(xué)習(xí)平臺。它的功能與特性,已經(jīng)可以支持超大規(guī)模的工業(yè)級AI開發(fā),為產(chǎn)業(yè)AI擔(dān)當(dāng)工業(yè)大生產(chǎn)底座。

所以中國人的視野和情懷中,百度與飛槳責(zé)無旁貸。

事實上,在經(jīng)濟(jì)放緩和行業(yè)資金鏈下行的大背景下,百度發(fā)展飛槳是很容易理解的。但如此超高速發(fā)展,屢次完成令世界驚訝的升級,確實是逆勢而行、萬人亦往的。飛槳升級不僅意味著巨大的投資,同時也意味著龐大的頂級人才投入,以及大量與產(chǎn)業(yè)開發(fā)者的交流溝通工作、巨大的教育和人才培育投入。

但是路總要有人修、石油總要有人找,產(chǎn)業(yè)AI基座總要有人去建。百度在此刻,承擔(dān)了一個令萬千開發(fā)者、令無聲的中國產(chǎn)業(yè)生態(tài)非常欣慰和驕傲的角色。

烏鎮(zhèn)互聯(lián)網(wǎng)大會上,百度CEO李彥宏首次提出了智能經(jīng)濟(jì)。智能經(jīng)濟(jì)不會招手而來,它跟石油經(jīng)濟(jì)、電力經(jīng)濟(jì)一樣,要從鉆井、電站做起。于是百度的選擇是,拿起飛槳,就去劃開一個時代好了。

百度CTO王海峰判斷,具備了標(biāo)準(zhǔn)化、自動化和模塊化的基本特征,正在讓深度學(xué)習(xí)推動AI進(jìn)入工業(yè)化大生產(chǎn)階段。這個階段里,百度的AI技術(shù)以及對AI開發(fā)的理解,沉淀為飛槳這個技術(shù)底座。讓飛槳變成上接應(yīng)用、下接芯片指令集的AI操作系統(tǒng)。

這種產(chǎn)業(yè)模式,事實上已經(jīng)發(fā)展出了中國AI獨(dú)有的產(chǎn)業(yè)生態(tài)原點(diǎn)。谷歌Tensorflow代表的主流歐美框架,并沒有集成開發(fā)者大量對工具、套件、預(yù)訓(xùn)練模型、定制化服務(wù)的產(chǎn)業(yè)需求,也缺少工業(yè)級AI訓(xùn)練開發(fā)的支撐特征,以及與產(chǎn)業(yè)互動的高強(qiáng)度方案。

這些是飛槳的獨(dú)創(chuàng),也是中國AI悄然發(fā)展出的一步優(yōu)勢。中國的各行各業(yè),全產(chǎn)業(yè)鏈都可能從中受益。

深度學(xué)習(xí)和飛槳,正在成為與中國未來魚水相融的時代之路。

如鋼鐵,如秋實,如夢幻:飛槳的一年

寫到這里,突然有種一夢忽醒的感覺。幾年來,我們都在跟蹤報道飛槳的快速進(jìn)化。尤其在今年,飛槳可以說真正沖破了產(chǎn)業(yè)級的壁壘,極大程度打開了AI與現(xiàn)實世界的融合。

雖然飛槳是一個個技術(shù)與工具構(gòu)成的,但卻很容易從它和它背后的百度人那里,感覺到飛槳的溫度、執(zhí)念和情感。

采訪中,我問吳甜和馬艷軍兩位博士,對飛槳一年來變化最大的感受是什么。

吳甜提到了車間。飛槳這座車間里,以前是一些簡易的流水線設(shè)備,對技工的要求很高。但現(xiàn)在車間里做出了高級車床,誰進(jìn)來都可以很快開始生產(chǎn)自己想要的零件。而未來,飛槳會變成充滿高精尖技術(shù),現(xiàn)代化的,世界最領(lǐng)先的AI車間。

而馬艷軍提到了房子。他說毛坯房也能住,精裝修房屋也能住,但生活品質(zhì)是不一樣的。飛槳這一年就是在把這座房子進(jìn)行了精裝,而且是生態(tài)化、環(huán)保化的精裝。并且蓋著蓋著房子,還蓋出了很多新的東西來。而大家覺得飛槳的升級令人目眩神迷,其實都是開發(fā)者的需求——建筑師的初心,是給業(yè)主想要的。

(百度深度學(xué)習(xí)技術(shù)平臺部總監(jiān)馬艷軍)

如果說AI的邏輯是一場統(tǒng)計學(xué)的春華,飛槳則在這一年中讓它結(jié)出了鋼鐵般堅硬的秋實。金融行業(yè)苛刻到恐怖的數(shù)據(jù)要求可以落地于飛槳;工業(yè)流水線上精準(zhǔn)到毫秒的時延條件生根于飛槳;企業(yè)主渴望AI,卻又難以承擔(dān)的成本難題,被飛槳的技術(shù)破解開。

飛槳把現(xiàn)實世界的不可能常識,變成了一切皆有可能的智能幻夢。

飛槳是什么?

是深度學(xué)習(xí)開發(fā)者峰會上,一座難求的熱絡(luò)。

是一位位田野里、工廠里的AI開發(fā)者,他們的倔強(qiáng)、不甘,與最終得到無數(shù)喝彩時,眼中的淚光閃爍。

是百度科學(xué)家,深夜依舊在解答開發(fā)者問題時的疲憊和執(zhí)著。

飛槳是這樣一個常識:如果我們跟眼前的困難握手言和,就會跟雄偉的未來擦肩而過。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-11-06
不信不可能:飛槳,劃一個時代的初心
11月5日,“WAVE SUMMIT+”2019深度學(xué)習(xí)開發(fā)者秋季峰會在北京召開,AI開發(fā)者再熟悉不過的、被稱為AI時代操作系統(tǒng)和百度AI底座的飛槳,又一次迎來了大規(guī)模技術(shù)升級。

長按掃碼 閱讀全文