AI在哪里?
大部分人可能會想到科幻電影,或者異常先進的實驗室。但是河北工業(yè)大學教授劉晶卻認為AI就在一間間工廠車間里。學習了六年深度學習,花兩個月時間跑了一百多家鋼鐵廠,最終,她把在鋼鐵熔煉復雜的配料過程中,老師傅們練就的三十年經驗,變成了三秒就能給出最優(yōu)配比的AI模型。
這個模型,每年可以為鋼鐵企業(yè)節(jié)省10%的原材料,把配料計算時間節(jié)省了90%。而她能做到這一切、把不可能化成可能的基礎,是應用了百度的飛槳平臺。
這一秒鐘,千千萬萬個這樣的故事,正同時上演在中國廣袤的大地上。AI不在別處,AI就在這里,在我們的農田、工廠、礦山、辦公室,在萬家燈火渺渺炊煙中。
AI從天邊來到千行萬業(yè)去,從不可能變成可能,就是一段完整的關于飛槳的故事。
(百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰)
11月5日,“WAVE SUMMIT+”2019深度學習開發(fā)者秋季峰會在北京召開,AI開發(fā)者再熟悉不過的、被稱為AI時代操作系統(tǒng)和百度AI底座的飛槳,又一次迎來了大規(guī)模技術升級。
畢竟還有不到兩個月2019就要結束,在關注飛槳狂飆突進的速度之外,此時或許有必要回望一下關于飛槳走過的路,未來的方向,以及不變的初心。
在這些故事、邏輯和蘊藏的情感里,我們可以真實地讀懂百度AI,讀懂深度學習開發(fā)者,讀懂中國智能時代的黎明。
盛宴:百度AI的彪悍速度
也許我們的讀者都還記得,今年4月,百度曾主辦了首場深度學習開發(fā)者峰會。當時很多讀者給我們留言,表示飛槳升級的技術實在太多了,只是讀完都感覺腦子有點跟不上。也有讀者說,別人家都是一場發(fā)布會說一兩個技術,百度是一場發(fā)布會說一打技術。
到了秋天,我們發(fā)現百度顯然決定在彪悍之路上一條道走到黑。這次的深度學習開發(fā)者峰會上,飛槳一口氣發(fā)布和重要升級21個產品方向。沒錯,一打已經不夠用了。
峰會現場,不少媒體同行和開發(fā)者表示,技術實在太多,邊聽邊記都跟不上速度——而百度居然就生猛地把它們一個個做出來了。
會上,百度深度學習技術平臺部總監(jiān)馬艷軍博士,介紹了飛槳產業(yè)級深度學習開源開放平臺全景圖,詳解了飛槳全新發(fā)布的21個產品方向。
其中,十分引入矚目的是,飛槳全新發(fā)布了4大面向應用任務的產業(yè)級端到端開發(fā)套件。包括NLP領域的ERNIE語義理解,CV方向的PaddleDetection目標檢測和PaddleSeg圖像分割,推薦方向的ElasticCTR點擊率預估,在關鍵產業(yè)應用中,滿足低成本和快速集成需求。
而全新發(fā)布的端側推理引擎Paddle Lite 2.0版本,則進一步提升了飛槳在硬件端的易用性和兼容性,具有超高 INT8 量化性能。
此外,飛槳還全新發(fā)布了3項深度學習技術工具組件:聯邦學習PaddleFL、圖神經網絡PGL和多任務學習PALM,從而將最先進的技術帶到產業(yè)實踐中。
EasyDL則發(fā)布了為算法工程師提供一站式解決方案的EasyDL專業(yè)版、PaddleHub 也全新升級,支持遷移學習與飛槳Master模式。
飛槳Master,也是本次峰會的一大亮點。這一模式把算力、數據、算法集成為產業(yè)級預訓練模型。與大量遷移學習工具平臺配合,構成了產業(yè)底座,為產業(yè)AI開發(fā)者奠定了全面基礎支撐。
此外,飛槳還進行了動態(tài)圖全新升級、新增大量算子庫、優(yōu)化API 接口,技術文檔更加完善;分布式GPU訓練相比其他主流框架實現了20%-100%的速度提升,分布式CPU訓練最大吞吐量達到行業(yè)6倍以上;官方模型從60+增加到了100+,提供預訓練模型超過200個;并且此次新開源了4個國際競賽冠軍模型;同時重磅推出了大量資源、課程、獎勵賦能的飛槳生態(tài)激勵計劃。
對于AI開發(fā)者來說,盛宴,當如是也。
初心:飛槳的來處與去處
在飛槳令人眼花繚亂的升級,保持超高速進化的背后,或許每個人都會想問這樣一個問題:到底是什么支撐了飛槳的奔跑?他們會一直這樣跑下去嗎?
畢竟這一年里,歐美主流深度學習框架的更新頻率并不高,而歐美大型科技公司對AI開發(fā)的技術升級也多次被批評過于緩慢。
當降速的歐美AI,碰上了飛速奔跑的中國AI與飛槳,我們當然會興奮,也自然會充滿疑問。百度AI技術平臺體系執(zhí)行總監(jiān)、深度學習技術及應用國家工程實驗室副主任吳甜,對這個問題的回答是,飛槳的升級動力來自百度AI團隊與產業(yè)開發(fā)者的高效頻繁溝通。
今天的飛槳,已經深深扎根于產業(yè)環(huán)境和開發(fā)生態(tài)當中。來自各個產業(yè)的AI需求、挑戰(zhàn)和瓶頸會隨時反饋給飛槳,開發(fā)者遇到的問題與挑戰(zhàn)會隨時與百度溝通。在這個開放和高效運轉的空間里,百度的AI科學家們與產業(yè)開發(fā)者形成了一個整體。開發(fā)者需要什么,飛槳就去做什么;產業(yè)智能化遇到了哪些無法克服的問題,百度就去調兵遣將解決它。
這樣的模式,是封閉在小環(huán)境中的互聯網公司所無法完成的,飛槳的奔跑,來自百度對技術的探索和追尋,同時也來自開發(fā)者和產業(yè)的真實聲音循環(huán)反饋。對此,我們的感觸也十分清晰,記得今年上半年在百度黃埔學院第一期畢業(yè)禮上,我們與開發(fā)者討論飛槳還有哪些問題。如今半年過去,這些問題真的已經被一個個升級所擊破。
其實不管是大規(guī)模分布式訓練、全硬件平臺支持、工業(yè)級模型庫,還是幾大領先世界的AI操作系統(tǒng)特性,飛槳的背后,是對一個簡單目標的極致化:讓AI開發(fā)具備更高性能、更低門檻。
這是飛槳的初心,而圍繞這個初心的窮思竭慮,變成了飛槳的升級速度和產業(yè)廣度。
圍繞開發(fā)易用性和開發(fā)性能升級,本次飛槳大規(guī)模升級里,有兩個關鍵點可以作為很好的解讀點。
一個是Master模式的誕生。所謂Master模式,從邏輯上看就是飛槳基于大量產業(yè)實踐,總結出產業(yè)AI開發(fā)者到底需要哪些數據、算法和算力。然后飛槳將其最大公約數變成預訓練模型。而對于企業(yè)來說,只要在此基礎上進行小規(guī)模的數據標注,就可以省去復雜模型的研發(fā)成本,以及龐大冗長的訓練流程,快速把AI能力結合到場景應用。
這是一個高強度面向產業(yè)實際應用的模式。它是百度AI技術的高度集成和沉淀,同時也來自飛槳對產業(yè)真實應用具體而微的理解,必須保證預訓練模型與產業(yè)最大效率接軌。百度一位專家,把Master模式比作飯館做菜時候的那鍋老湯——產業(yè)應用者只需要享受一勺下去味美絕倫,而不用等待漫長而復雜的熬制過程。
再一個就是上面所說,飛槳端到端開發(fā)套件的發(fā)布。今天的情況是,眾多產業(yè)開發(fā)者并不具備深厚的AI功底,但需要迫切能解決問題的AI能力。端到端開發(fā)套件,就可以讓一個只有基礎編程能力的技術人員,利用套件工具來解決具備主流應用性的AI問題。比如語義理解是智能語音相關AI問題的核心;視覺分割和圖像檢測是機器視覺能力最大的應用需求;CTR推薦具備從互聯網到實體經濟極其廣泛的應用覆蓋度。飛槳把這些套件提前做好,就可以把相應問題的AI開發(fā)門檻降到最低程度,產業(yè)可以無縫進入AI時代。
這些技術與產業(yè)智慧的碰撞結果,是將飛槳打造成了源于產業(yè)實踐,與產業(yè)共進的深度學習開源開放平臺。而未來,飛槳還會繼續(xù)進化,畢竟核心框架的進化還在進行時、開發(fā)者的需求還有無窮無盡、中國產業(yè)智能化的大門剛剛開啟。
(百度AI技術平臺體系執(zhí)行總監(jiān)、深度學習技術及應用國家工程實驗室副主任吳甜)
吳甜認為,未來飛槳還會持續(xù)發(fā)展超大規(guī)模分布式計算、異構計算能力,定位于全硬件平臺支持、端云邊結合。深度學習平臺還要繼續(xù)向前,推進核心框架持續(xù)向完美發(fā)展;而飛槳的四大領先特性也會持續(xù)前進,堅持面向產業(yè)級應用,挖掘中國全產業(yè)擁抱AI的可能。
飛槳的去處,歸根結底是百度AI科學家們看到了這樣一個機會:中國擁有最廣泛全面的產業(yè)鏈,而飛槳則提供了當今最快的AI基礎設施進化速度。
廣和快的碰撞,往往是奇跡的原點。
承擔:智能時代的中國情懷
很多西方學者都提出過這樣一個觀點:中國的現代化進程,尤其是近年的經濟騰飛,堪稱集體主義在人類文明史中完成的奇跡。
中國人的經濟智慧,是調集力量克服困難,哪怕承擔一部分犧牲,也要把基礎做好,把起點做扎實。然后在此基礎上建設產業(yè)、發(fā)展生態(tài),讓智慧的中國人有舞臺騰飛。從互聯網、通訊、高鐵、城建莫不如此,這也是中國之所以被稱作“基建狂魔”的原因。
AI時代,人類正在悄然抵達第四次工業(yè)革命的起點。而過往的三次工業(yè)革命,東方更多時候都是看客。這次,中國AI和產業(yè)智能化顯然不想再旁觀和等待了。
那么誰來擔當中國AI時代的“基建狂魔”呢?
自2016年正式開源以來,飛槳是中國首個也是目前國內唯一全面開源開放、技術領先、功能完備的產業(yè)級深度學習平臺。它的功能與特性,已經可以支持超大規(guī)模的工業(yè)級AI開發(fā),為產業(yè)AI擔當工業(yè)大生產底座。
所以中國人的視野和情懷中,百度與飛槳責無旁貸。
事實上,在經濟放緩和行業(yè)資金鏈下行的大背景下,百度發(fā)展飛槳是很容易理解的。但如此超高速發(fā)展,屢次完成令世界驚訝的升級,確實是逆勢而行、萬人亦往的。飛槳升級不僅意味著巨大的投資,同時也意味著龐大的頂級人才投入,以及大量與產業(yè)開發(fā)者的交流溝通工作、巨大的教育和人才培育投入。
但是路總要有人修、石油總要有人找,產業(yè)AI基座總要有人去建。百度在此刻,承擔了一個令萬千開發(fā)者、令無聲的中國產業(yè)生態(tài)非常欣慰和驕傲的角色。
烏鎮(zhèn)互聯網大會上,百度CEO李彥宏首次提出了智能經濟。智能經濟不會招手而來,它跟石油經濟、電力經濟一樣,要從鉆井、電站做起。于是百度的選擇是,拿起飛槳,就去劃開一個時代好了。
百度CTO王海峰判斷,具備了標準化、自動化和模塊化的基本特征,正在讓深度學習推動AI進入工業(yè)化大生產階段。這個階段里,百度的AI技術以及對AI開發(fā)的理解,沉淀為飛槳這個技術底座。讓飛槳變成上接應用、下接芯片指令集的AI操作系統(tǒng)。
這種產業(yè)模式,事實上已經發(fā)展出了中國AI獨有的產業(yè)生態(tài)原點。谷歌Tensorflow代表的主流歐美框架,并沒有集成開發(fā)者大量對工具、套件、預訓練模型、定制化服務的產業(yè)需求,也缺少工業(yè)級AI訓練開發(fā)的支撐特征,以及與產業(yè)互動的高強度方案。
這些是飛槳的獨創(chuàng),也是中國AI悄然發(fā)展出的一步優(yōu)勢。中國的各行各業(yè),全產業(yè)鏈都可能從中受益。
深度學習和飛槳,正在成為與中國未來魚水相融的時代之路。
如鋼鐵,如秋實,如夢幻:飛槳的一年
寫到這里,突然有種一夢忽醒的感覺。幾年來,我們都在跟蹤報道飛槳的快速進化。尤其在今年,飛槳可以說真正沖破了產業(yè)級的壁壘,極大程度打開了AI與現實世界的融合。
雖然飛槳是一個個技術與工具構成的,但卻很容易從它和它背后的百度人那里,感覺到飛槳的溫度、執(zhí)念和情感。
采訪中,我問吳甜和馬艷軍兩位博士,對飛槳一年來變化最大的感受是什么。
吳甜提到了車間。飛槳這座車間里,以前是一些簡易的流水線設備,對技工的要求很高。但現在車間里做出了高級車床,誰進來都可以很快開始生產自己想要的零件。而未來,飛槳會變成充滿高精尖技術,現代化的,世界最領先的AI車間。
而馬艷軍提到了房子。他說毛坯房也能住,精裝修房屋也能住,但生活品質是不一樣的。飛槳這一年就是在把這座房子進行了精裝,而且是生態(tài)化、環(huán)?;木b。并且蓋著蓋著房子,還蓋出了很多新的東西來。而大家覺得飛槳的升級令人目眩神迷,其實都是開發(fā)者的需求——建筑師的初心,是給業(yè)主想要的。
(百度深度學習技術平臺部總監(jiān)馬艷軍)
如果說AI的邏輯是一場統(tǒng)計學的春華,飛槳則在這一年中讓它結出了鋼鐵般堅硬的秋實。金融行業(yè)苛刻到恐怖的數據要求可以落地于飛槳;工業(yè)流水線上精準到毫秒的時延條件生根于飛槳;企業(yè)主渴望AI,卻又難以承擔的成本難題,被飛槳的技術破解開。
飛槳把現實世界的不可能常識,變成了一切皆有可能的智能幻夢。
飛槳是什么?
是深度學習開發(fā)者峰會上,一座難求的熱絡。
是一位位田野里、工廠里的AI開發(fā)者,他們的倔強、不甘,與最終得到無數喝彩時,眼中的淚光閃爍。
是百度科學家,深夜依舊在解答開發(fā)者問題時的疲憊和執(zhí)著。
飛槳是這樣一個常識:如果我們跟眼前的困難握手言和,就會跟雄偉的未來擦肩而過。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。