PaddlePaddle的榮耀瞬間,隱藏著大時代的中國式AI需求

原標題:PaddlePaddle的榮耀瞬間,隱藏著大時代的中國式AI需求

以前看一部戰(zhàn)爭片的時候,對一位軍工廠領導的臺詞印象深刻。他是這么說的:前方的戰(zhàn)士看見我們運過去的炮彈,心里比看見麻花都甜。

在一項事業(yè)或者工程進行當中,從業(yè)者對核心生產(chǎn)資源的那種期待,是外人難以估量和理解的。無論是戰(zhàn)爭、醫(yī)療還是工程,在現(xiàn)代工業(yè)體系中,毫無疑問資源就是一切。這種對基礎資源的期待,如今也發(fā)生在AI產(chǎn)業(yè)當中。

AI的核心資源當然有很多。但毫無疑問,深度學習框架是其中之一。毋庸諱言,中國的深度學習框架發(fā)展比歐美要晚,起步階段的失位和整個產(chǎn)業(yè)的高速發(fā)展,造成了中國AI開發(fā)者和創(chuàng)業(yè)公司們某種程度的“框架饑渴癥”。

好在這種情況正在被積極“治療”中。近兩年我們可以看到百度PaddlePaddle不斷進行重大升級。而剛剛傳來消息,百度宣布成立深度學習技術平臺部,其隸屬AI技術平臺體系(AIG),由兩位AI技術專家于佃海、馬艷軍分任總架構(gòu)師和部門負責人。

成立專門部門進行打造,毫無疑問意味著PaddlePaddle的戰(zhàn)略地位進一步提升。從一個技術平臺到一個獨立部門,這個中國深度學習框架史上的首次操作,應該可以看做AI產(chǎn)業(yè)的一次飛躍。

這次起跳意味著什么?有什么前因和后果?

讓我們把PaddlePaddle的幸福時刻定格在這里,看一看深度學習框架的中國之旅,背后都有怎樣的辛秘。

一個巨大的需求

PaddlePaddle之所以不斷上升,從技術資源、人才資源,再到今天的企業(yè)架構(gòu)資源,相繼往這個有點萌的名字上傾斜,背后的道理很簡單:PaddlePaddle卡住了一個巨大而且必需的市場需求。

百度于2013年成立深度學習實驗室,并推出自主研發(fā)的深度學習平臺,即PaddlePaddle的前身;2016 年 8 月,PaddlePaddle正式開源。該平臺對標谷歌TensorFlow,是中國首個、也是當前國內(nèi)唯一開源開放的深度學習框架。而這個首個,也映射著當時中國AI開發(fā)者三個難以搞定的真實需求:

一、中文需求

TensorFlow、caffe這樣的框架,當然是沒有中文文檔和訓練數(shù)據(jù)的。但是語言又是AI世界中的重中之重??偛荒茏屩袊袌錾系腁I系統(tǒng)都說英語吧?在PaddlePaddle開源之前,還有個更痛苦的情況是,如果中文AI開發(fā)者訓練的算法出問題了,他就必須越洋電話和郵件去找歐美的客服。這其中的溝通成本和效率可想而知。

所以當PaddlePaddle開源,百度開始大規(guī)模為開發(fā)者提供中文訓練文檔,以及中文客服,并不斷共享百度在語音交互這個強勢領域的數(shù)據(jù)與算法技術,這對于中國AI開發(fā)者當然是雪中送炭。僅僅靠這一點,在AI開發(fā)的興起時刻,PaddlePaddle就確立了存在的意義與必要性。

二、大規(guī)模應用需求

據(jù)說開發(fā)PaddlePaddle,最早在百度內(nèi)部的目的就是應對TF等框架,不適應大規(guī)模訓練的問題。由于TF這樣的框架更偏于學院化和深層開發(fā),這就導致企業(yè)級AI應用非常難適應。而中國恰恰是一個流量大、數(shù)據(jù)多、用戶存量大的市場,歐美的小而精模式當然水土不服。于是當PaddlePaddle高舉大規(guī)模應用的旗幟出現(xiàn),中國AI開發(fā)者,甚至不少歐美開發(fā)者當然蜂擁而至。如今PaddlePaddle在持續(xù)升級下,系統(tǒng)穩(wěn)定性已經(jīng)可以支持工業(yè)界服務的規(guī)模,這在業(yè)界中也是首屈一指的,更加適合了中國市場AI與傳統(tǒng)行業(yè)結(jié)合、大規(guī)?;ヂ?lián)網(wǎng)AI應用的真實情況。

三、國家安全需求

中興事件已經(jīng)可以看出,底層技術掌握在其他國家手中是相當可怕的一件事。一言不合就給你掐斷上游,簡直沒地方講理去。

試想一下,安防、軍事等領域的AI應用,假如用歐美框架訓練那是多么可怕的一件事?這種情況下,完全自主掌握的AI框架變得格外重要。

而到目前為止PaddlePaddle已經(jīng)完成了從芯片到文檔,從框架到應用工具的全面自主化。其還在NLP、知識圖譜、語音圖像等領域進行了深度布局,能夠滿足從產(chǎn)業(yè)界到社會服務的不同AI開發(fā)需求,這也就讓整個國家經(jīng)濟體的AI發(fā)展安全系數(shù)大為飆升。所謂最適合中國國情的深度學習框架,并不只是說說而已。

占領了這些核心需求,PaddlePaddle開始了不斷積累升級,并在適當時刻準備沖刺與跳躍。這次百度成立深度學習技術平臺部,可以看做PaddlePaddle產(chǎn)業(yè)根基來到了全新階段。

日漸穩(wěn)固的根基

想要贏得未來,就必須穩(wěn)固住現(xiàn)在的優(yōu)勢與地位。而PaddlePaddle來到可獨立成為部門的節(jié)點上,實際也標志著百度對PaddlePaddle目前產(chǎn)業(yè)根基與身位優(yōu)勢的判斷。

可以看到,三方面的領先優(yōu)勢支撐了PaddlePaddle可以獨立出來,擴大招兵買馬規(guī)格,走上產(chǎn)業(yè)快速迭代的快車道:

一、技術已經(jīng)積累充足

深度學習框架的好壞,除了開發(fā)基礎之外,主要有幾個方面的技術來評定:工具是否健全而充足;顆粒精細程度能否滿足深度開發(fā)需求;社區(qū)建設與數(shù)據(jù)資源的建設水平。這些領域,中國的深度學習框架是一個必須快速追趕歐美,必須在緊迫時間完成連續(xù)升級的過程。好在PaddlePaddle基本已經(jīng)證明了技術建設速度可以被信任。

2016年開源之后,2017 年 11 月,百度發(fā)布更細粒度的新一代深度學習框架——PaddlePaddle Fluid;2018年7月的百度AI開發(fā)者大會(Baidu Create 2018)上,百度發(fā)布PaddlePaddle 3.0,包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以讓開發(fā)者平等便捷獲取頂尖AI能力的組件。

到目前為止,PaddlePaddle已經(jīng)組成了數(shù)據(jù)、工具、框架上的全面技術優(yōu)勢,可以與歐美一線框架看齊。

二、人才優(yōu)勢不斷擴大

這次成立深度學習技術平臺部,據(jù)說PaddlePaddle將一舉成為40人的研發(fā)團隊。而且兩位領頭人都在百度AI業(yè)務最前線奮戰(zhàn)多年,不僅對深度學習的理論和算法有深刻理解,還具有超強的產(chǎn)品和工程能力。

資料顯示,早在2010年,于佃海作為核心成員之一推動了百度搜索使用機器學習的排序算法;2012年,百度開始深度學習的研究,于佃海是第一批研究人員,他帶頭研發(fā)的深度學習技術被百度多個產(chǎn)品廣泛應用。馬艷軍曾獲國家科技進步獎,并曾經(jīng)負責百度信息流內(nèi)容的技術研發(fā),大幅提升了信息流的用戶體驗,支撐了百度信息流實現(xiàn)高速增長。

兩位T10級別業(yè)界領軍人物帶隊,展現(xiàn)出了百度豪華的AI人才儲備。圍繞PaddlePaddle,無論是人才成長還是人才吸引力,都已經(jīng)達成了國際水準。

三、身位優(yōu)勢不斷加強

在AI產(chǎn)業(yè)發(fā)展上行到新局面,AI與IoT結(jié)合不斷加深、傳統(tǒng)行業(yè)應用AI潛力被釋放、無人駕駛等領域風口來臨的時候,AI基礎設施的價值也相應地被放大。但是就國內(nèi)市場而言,想要在短期內(nèi)再出現(xiàn)可開源,并且工具化相應完善的深度學習框架,基本已經(jīng)是極小概率事件。而且社群建設與生態(tài)建設更是需要時間。早投入早回報,已經(jīng)開始讓PaddlePaddle呈現(xiàn)出產(chǎn)業(yè)周期紅利。

戰(zhàn)略資源不斷升級,百度體系內(nèi)的地位不斷明晰,國際影響力與吸引力不斷增強。等等優(yōu)勢讓PaddlePaddle值得被加大投入力度,達成更高水準的產(chǎn)業(yè)聚合。而與此同時,PaddlePaddle的未來要走向哪里,似乎也再愈發(fā)的明晰了起來。

已然清晰的方向

成立專門部門之后,PaddlePaddle會走向何方,這或許是一個大眾比較關心的問題。但是就PaddlePaddle的過往發(fā)展歷程而推斷,其發(fā)展方向其實一直非常明確。所做的是在推動產(chǎn)業(yè)迭代速率,為已經(jīng)清晰明確的方向添柴加火。

從過往分析,“兩化一目標”似乎可以被視作PaddlePaddle的未來。

一、基礎設施化

PaddlePaddle自誕生之日起,到不斷的重大升級和產(chǎn)業(yè)迭代,都是以成為中國AI產(chǎn)業(yè)與廣大開發(fā)者的基礎設施為目標。而在今天的獨立特性確立,生態(tài)化基礎牢固之后,PaddlePaddle勢必將進一步加強自身成為AI產(chǎn)業(yè)基礎設施的優(yōu)勢,與產(chǎn)業(yè)深度結(jié)合,不斷向開發(fā)者開放新的資源與產(chǎn)業(yè)優(yōu)勢。伴隨著百度在無人駕駛、對話式AI,以及AI技術綜合應用領域的擴展,PaddlePaddle也將持續(xù)加深行業(yè)下沉力,完成其成為基礎開發(fā)必經(jīng)之路的產(chǎn)業(yè)使命。

二、生態(tài)化

AI不能閉環(huán),必須無功利地開放和共享,造就持續(xù)有生命力的AI開發(fā)環(huán)境,這是已經(jīng)在世界AI開發(fā)舞臺上得到印證的判斷。但中國的AI開發(fā)生態(tài)僅剛剛起步,必須有更強的生態(tài)賦能方案出臺,催化開發(fā)生態(tài)的成熟。

這是PaddlePaddle的第二個目標,也是其成立專門部門的核心支撐因素:提高生態(tài)賦能能力,建設縱深度和生命力更強的AI開發(fā)群落。

目前我們看到PaddlePaddle對開發(fā)者的全方位扶持已經(jīng)不僅局限于技術框架。公開課、AI大賽、與高校合辦師資培訓班等等方式都成為常態(tài)。而穩(wěn)固的生態(tài)會堆積成雪球效應,這也是AI產(chǎn)業(yè)的必須要求。

在百度AI開發(fā)者大會上,我們已經(jīng)看到PaddlePaddle生態(tài)化的成果。比如北京工業(yè)大學的四位學生利用PaddlePaddle制造了一臺智能桃子分揀機,實現(xiàn)桃子的自動分揀;援藏醫(yī)生陳靜飛借助基于PaddlePaddle的定制化訓練與服務平臺EasyDL,進行顯微鏡下寄生蟲蟲卵識別。這些能夠改變產(chǎn)業(yè)效率,甚至承擔社會責任的AI開發(fā),都是從PaddlePaddle的生態(tài)化進程中汲取而來。

三、目標專精于工業(yè)應用

AI的未來在于與經(jīng)濟體結(jié)合,成為工業(yè)體系換發(fā)活力的再生藥水。那么對深度學習開發(fā)框架的最高要求,就是能夠全面賦能工業(yè)體系,提高工業(yè)級應用AI的可能性,降低準入門檻。

厲兵秣馬的PaddlePaddle,已經(jīng)將目標對準了工業(yè)級應用。目前PaddlePaddle已經(jīng)開放近20種工業(yè)級模型,各項AI技術被廣泛應用于生產(chǎn)中。

從PaddlePaddle的明晰目標中可以看出,中國AI開發(fā)的大任只是剛剛開始而已。有了基礎,還需要有不斷的投入和社會意愿的激發(fā)。但無論怎么說,PaddlePaddle都是一種開始。

美妙的開始,是一切想象力與恢弘故事的源頭。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2018-07-27
PaddlePaddle的榮耀瞬間,隱藏著大時代的中國式AI需求
原標題:PaddlePaddle的榮耀瞬間,隱藏著大時代的中國式AI需求以前看一部戰(zhàn)爭片的時候,對一位軍工廠領導的臺詞印象深刻。他是這么說的:前方的戰(zhàn)士看見我們運過去的炮彈,心里比看見麻花都甜。

長按掃碼 閱讀全文