工業(yè)革命的秋之漣漪(一):百度飛槳&AI引擎

原標(biāo)題:工業(yè)革命的秋之漣漪(一):百度飛槳&AI引擎

18世紀(jì)中后期,人類推開了工業(yè)革命的大門。

在此后的近250年里,世界經(jīng)濟(jì)迎來了從未有過的發(fā)展曲線,漫長的中古時期轟然倒塌,現(xiàn)代化的晨曦點燃了文明之光。

此后的歲月里,每當(dāng)經(jīng)濟(jì)發(fā)展遇到瓶頸,社會問題凸顯,新的工業(yè)革命總會適時出現(xiàn)。從蒸汽革命、電氣革命,到信息革命,人類已經(jīng)完成了三輪奇跡般的生產(chǎn)力增長。

那么,第四次呢?它將出現(xiàn)在何時,以何種技術(shù)作為主軸,又如何一步步改變我們的社會經(jīng)濟(jì)?毫無疑問,回答這些問題在這個時代無比重要。

幸運的是,互聯(lián)網(wǎng)、云計算、大數(shù)據(jù),再到AI的一系列發(fā)展,基本已經(jīng)讓第四次工業(yè)革命的首要問題產(chǎn)生了共識:這次全球行動注定由智能化來指揮,以深度學(xué)習(xí)為代表的第三次AI崛起,將為各行業(yè)生產(chǎn)力再次飛躍提供原動力。

而與前三次工業(yè)革命不同,即將迎來的智能革命中,中國首次與世界站上了同一起點。

那么接下來的問題,是產(chǎn)業(yè)智能革命從理論可行到實際發(fā)展,如何一步步填補(bǔ)AI與現(xiàn)實生產(chǎn)力間的縫隙。這個10月,作為中國唯一功能完備的深度學(xué)習(xí)開源平臺,百度飛槳將迎來一系列走入工業(yè)化生產(chǎn)與現(xiàn)實世界的大事件。我們發(fā)現(xiàn),沿著飛槳落地的腳步,恰好可以完整描述出從AI技術(shù),到可用平臺,再到產(chǎn)業(yè)實踐與經(jīng)濟(jì)矩陣,深度學(xué)習(xí)一步步擴(kuò)散到現(xiàn)實世界中的行為邏輯。

如果說,得出AI與產(chǎn)業(yè)結(jié)合的可能性,是智能革命的春芽;那么收獲AI滲透現(xiàn)實的真實路徑,就是這場智能革命的秋實。恰好時至華夏大地滿眼秋色,我們希望用一個系列,來追尋從飛槳蛻變,到第四次工業(yè)革命的先聲。從深度學(xué)習(xí)的一粒石子,到產(chǎn)業(yè)與國民經(jīng)濟(jì)的層層波瀾,改變正在這個秋天層層震蕩開去——也許可以稱之為,工業(yè)革命的秋之漣漪。

第一層的故事,關(guān)于飛槳產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺。10月16日,首屆世界科技與發(fā)展論壇在北京舉辦,面對著現(xiàn)場來自全球20多個國家和地區(qū)的200多名院士、諾貝爾獎獲得者、世界重要科技組織會員、大學(xué)校長和企業(yè)家,百度CTO王海峰發(fā)布“飛槳產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺”,智能時代的操作系統(tǒng),再次得以升級。

這件事改變了什么?讓我們先從一切故事的背景說起:產(chǎn)業(yè)智能化的沃土,我們的中國。

一片土地的期望

工業(yè)革命是需要溫床的,18世紀(jì)完成土地和宗教改革的英倫半島,19世紀(jì)急需全球化經(jīng)濟(jì)的歐洲大陸,20世紀(jì)在硅晶片上孕育新時代的美利堅。必須有技術(shù)底座和強(qiáng)烈需求,才能孕育工業(yè)革命的動力和舞臺。

而今天的中國,廣泛的產(chǎn)業(yè)升級需求和供給側(cè)改革,構(gòu)筑了充分的工業(yè)革命需求;而互聯(lián)網(wǎng)的長足發(fā)展,數(shù)據(jù)與計算底層設(shè)施的建造,則為智能技術(shù)提供了生長溫床。二者相加,最適合AI技術(shù)投入產(chǎn)業(yè)應(yīng)用,同時也是最需要AI技術(shù)完成生產(chǎn)力迭代的地方,都變成了中國。

智能革命發(fā)生于中國,是三種情況的交匯。首先互聯(lián)網(wǎng)的長足發(fā)展,醞釀了人才與技術(shù)的底座,這股力量需要被引導(dǎo)向產(chǎn)業(yè)智能的新藍(lán)海;其次,中國的產(chǎn)業(yè)結(jié)構(gòu)完整而廣泛,各行業(yè)或多或少都蘊(yùn)藏了可以被AI技術(shù)完成“提質(zhì)增效”的空間。在中美科技齊頭發(fā)展的國際新局勢下,國家經(jīng)濟(jì)整體對AI技術(shù)應(yīng)用具有深層渴望。一系列需求構(gòu)成了產(chǎn)業(yè)智能化命題最大的市場空間;同時需要看到的是,中國數(shù)字化滲透度不如發(fā)達(dá)國家,各產(chǎn)業(yè)的經(jīng)濟(jì)發(fā)展周期、人才儲備情況、數(shù)字化水平參差不齊,這讓AI深入產(chǎn)業(yè)充滿了具體性與不確定性。AI基礎(chǔ)平臺與行業(yè)智慧的交融有待進(jìn)一步探索。

全球前列的技術(shù)水準(zhǔn)、廣泛龐大的市場需求、復(fù)雜具體的行業(yè)挑戰(zhàn),這三者共同構(gòu)成了這片土地與AI技術(shù)相遇時驚喜與困難并存的現(xiàn)狀。雖然廣義的前景無限光明,但當(dāng)智能革命深入某個具體行業(yè)時,問題往往層出不窮。以深度學(xué)習(xí)為代表的第三代AI技術(shù),與以往軟件應(yīng)用不同的地方在于,它以機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)特征,需要經(jīng)歷開發(fā)、訓(xùn)練、推理部署,最終走向產(chǎn)業(yè)應(yīng)用。但這整套流程對于垂直行業(yè)來說,每個步驟都充斥著挑戰(zhàn):

1、AI模型的開發(fā)效率低、開發(fā)成本大,人才難以尋找。

2、能夠支撐產(chǎn)業(yè)級別的AI訓(xùn)練,需要龐大算力和巨大的數(shù)據(jù)量,以及精度保障能力。這個環(huán)節(jié)往往是企業(yè)的最大負(fù)擔(dān)。

3、模型在推理端的高時延、高能耗、低速度,容易造成AI應(yīng)用不達(dá)標(biāo),形成臨門一腳的失誤。

4、千差萬別的行業(yè)需求和應(yīng)用特征,對AI技術(shù)的標(biāo)準(zhǔn)化、模塊化、行業(yè)智慧結(jié)合提出了廣泛挑戰(zhàn)。

綜合起來看,中國引領(lǐng)第四次工業(yè)革命,在今天希望巨大同時挑戰(zhàn)巨大。解決這些問題,有很多種思路。但有一個邏輯是無可否認(rèn)的:今天開發(fā)深度學(xué)習(xí)模型,需要開發(fā)框架的支持;未來的產(chǎn)業(yè)智能應(yīng)用,需要高度可用的操作系統(tǒng)作為底層算力、算法與行業(yè)應(yīng)用的中間件——無論是今天還是未來,飛槳的戰(zhàn)略價值都與中國的期待緊密相連。

一座車站

在討論飛槳的價值生長時,我們必須要注意產(chǎn)業(yè)節(jié)奏的變化。

深度學(xué)習(xí)模型的開發(fā),需要以開發(fā)框架作為基礎(chǔ)工具,這在今天已經(jīng)成為了常識。支持高并發(fā)訓(xùn)練部署的完整框架,是飛槳誕生時的價值指向,這時它是AI開發(fā)者的一種選擇;隨著產(chǎn)業(yè)智能化不斷加深,國民經(jīng)濟(jì)應(yīng)用AI的需求加強(qiáng),自主可控變成了安全前提,這就讓飛槳這個中國唯一功能完備開源平臺的戰(zhàn)略價值順勢凸顯;接下來,占據(jù)了關(guān)鍵位置的飛槳,可用向上向下生長出更多算法、工具與解決方案優(yōu)勢,成為盡可能容納開發(fā)、訓(xùn)練、部署周期,一站式解決AI應(yīng)用困境的操作系統(tǒng)。

這個邏輯就像車站。當(dāng)鐵路貫通時,車站是必需品。而當(dāng)中國AI的鐵軌上,只有飛槳一座車站時,這座車站可以進(jìn)一步擴(kuò)容功能,為旅客提供盡可能多的服務(wù)。我們知道很多車站成長為了商業(yè)綜合體,就是這個邏輯。

在王海峰發(fā)布的飛槳全景圖中,我們可以看到飛槳的目標(biāo),是打造一個向下抵達(dá)芯片層、向下輸出到應(yīng)用層,容納其中所有的開發(fā)支持與產(chǎn)業(yè)應(yīng)用需求,從而打造標(biāo)準(zhǔn)化、模塊化、自動化的AI入口。這就像智能手機(jī)時代,開發(fā)者只需要學(xué)習(xí)安卓/IOS,再懂基礎(chǔ)的標(biāo)準(zhǔn)語言就可以進(jìn)行開發(fā)。AI時代想要真正到來,同樣需要一套類似邏輯的操作系統(tǒng)——這就是飛槳的發(fā)展軌跡。

目前,飛槳已經(jīng)形成了體系完善、工具豐富的開發(fā)平臺生態(tài)。在核心框架層面,提供開發(fā)、訓(xùn)練和預(yù)測一整套的技術(shù)能力;在此之上,官方支持包括自然語言處理、視覺、推薦和語音等在內(nèi)的豐富的工業(yè)級模型庫,以及支持語義理解、目標(biāo)監(jiān)測、圖像分割等任務(wù)的端到端開發(fā)套件。工具和服務(wù)平臺層面,提供自動化深度學(xué)習(xí)、遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、多任務(wù)學(xué)習(xí)等工具組件和EasyDL、AI Studio等降低技術(shù)門檻的服務(wù)平臺。最終形成了集深度學(xué)習(xí)訓(xùn)練和預(yù)測框架、模型庫、開發(fā)套件、工具組件和服務(wù)平臺等為一體,功能完備、全面開源開放的產(chǎn)業(yè)級深度學(xué)習(xí)平臺。

當(dāng)深度學(xué)習(xí)的水滴投入現(xiàn)實世界,飛槳是它激起的第一層波瀾。我們可能需要追尋的,就是這層漣漪如何向更遠(yuǎn)處蔓延。其實答案已經(jīng)顯露,王海峰對飛槳的最新定義,是產(chǎn)業(yè)級級深度學(xué)習(xí)開源開放平臺——顯然,這里的關(guān)鍵點是“產(chǎn)業(yè)級”三個字。

這三個字代表了飛槳接下來的發(fā)展方向。一座車站,可能生長出一個商業(yè)綜合體。接下來,更可能誕生一座城市,美國的奧爾良、芝加哥;中國的鄭州、石家莊莫不如此。飛槳之城,就建立在第四次工業(yè)革命的中國底座中。

一條線

或許很多朋友,覺得“產(chǎn)業(yè)級”無非就是一個修飾。但是百度技術(shù)體系向來是不會隨便添加修飾詞的。相反,他們更喜歡把重要的技術(shù)更新,輕描淡寫地說出來。

想要理解飛槳的“產(chǎn)業(yè)級”蛻變,需要知道機(jī)械學(xué)中有個概念叫做“工業(yè)紅線”。我們自己在家也可以DIY一個發(fā)電機(jī)或者蒸汽機(jī),實驗室里可以制造機(jī)器復(fù)雜的機(jī)械設(shè)備,但是這些設(shè)備都無法投入工業(yè)應(yīng)用,就是因為他們無法越過“工業(yè)紅線”。

一種技術(shù)和設(shè)備,想要達(dá)到工業(yè)標(biāo)準(zhǔn),需要滿足一系列條件:成本控制、使用難度控制、生產(chǎn)效率達(dá)標(biāo)、模塊化組件、大規(guī)模生產(chǎn)支撐等等。所以產(chǎn)業(yè)工業(yè)化必須是一套完整的體系相互支撐,任何一個創(chuàng)新點如何達(dá)不到標(biāo)準(zhǔn),都可能摧毀整個產(chǎn)業(yè)鏈的效率。

在今天,企業(yè)知道AI好用卻無法用,所有困難本質(zhì)上都因為AI相關(guān)工具和平臺,無法達(dá)到切合產(chǎn)業(yè)生產(chǎn)需求的工業(yè)級標(biāo)準(zhǔn)。夠快、夠大、夠簡單,這些聽起來簡單的話題,其實是極其困難的部分。

而飛槳加上“產(chǎn)業(yè)級”,就是百度決定闖過這條工業(yè)紅線的標(biāo)志。具體來說,飛槳踏過產(chǎn)業(yè)級紅線,來自于四個方面國際領(lǐng)先技術(shù)的突破:

1、人才線

想要挺進(jìn)工業(yè)生產(chǎn),我們就不能假定每個行業(yè)的AI開發(fā)者和技術(shù)人員都是天才大神。然而工業(yè)級的深度學(xué)習(xí)模型卻在持續(xù)復(fù)雜化,代碼結(jié)構(gòu)的理解難度不斷提升。這給開發(fā)人員帶來的巨大挑戰(zhàn)。

想要AI走進(jìn)產(chǎn)業(yè),就必須讓開發(fā)簡單易懂,與如今同行的編程教育和行業(yè)并軌。為此,飛槳完成了基于編程邏輯的深度學(xué)習(xí)框架技術(shù),同時支持聲明式和命令式編程,兼具開發(fā)靈活性和穩(wěn)定性。也就是說,如今的編程從業(yè)者可以不經(jīng)歷漫長學(xué)習(xí)就能使用飛槳,企業(yè)的AI人才門檻也將極大降低。

2、訓(xùn)練線

工業(yè)級AI的基礎(chǔ)特征,就是訓(xùn)練所用的數(shù)據(jù)和算力異常巨大,尤其是大規(guī)模個性化推進(jìn)場景,需要超大規(guī)模的稀疏性特征訓(xùn)練,堪稱AI中的重工業(yè)。再精巧是算法和工具,如果適配超大規(guī)模訓(xùn)練都沒有意義。踏過訓(xùn)練線,是AI操作系統(tǒng)駛向未來的核心。

為此,飛槳平臺率先突破了超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù),實現(xiàn)了世界首個支持千億特征、萬億參數(shù)、數(shù)百節(jié)點的開源大規(guī)模訓(xùn)練平臺,攻克了超大規(guī)模深度學(xué)習(xí)模型的在線學(xué)習(xí)難題,實現(xiàn)了萬億規(guī)模參數(shù)模型的實時更新。這就像工業(yè)領(lǐng)域的超大熔爐和巨型鍛造機(jī),為未來更復(fù)雜的產(chǎn)業(yè)需求打造平臺底座。

3、硬件線

AI駛向工業(yè)革命,一個基本邏輯就是需要把深度學(xué)習(xí)技術(shù)與現(xiàn)實中的無數(shù)設(shè)備相結(jié)合,并且兼容復(fù)雜的異構(gòu)算力、差異化平臺,組成能夠適應(yīng)行業(yè)需求的解決方案。引申到操作系統(tǒng)中,這就需要技術(shù)中間層提供端到端部署的部署能力,實現(xiàn)軟硬件一體優(yōu)化。

這個領(lǐng)域,飛槳為產(chǎn)業(yè)世界提供多端多平臺部署的高性能推理引擎。在推理方面,飛槳平臺不僅可以和其他開源框架訓(xùn)練的模型無縫銜接,還可以輕松的部署到X86 CPU、ARM CPU、Nividia GPU、Mali GPU等不同架構(gòu)的平臺設(shè)備上。同時提供領(lǐng)先的推理速度。經(jīng)過跟華為麒麟NPU的軟硬一體優(yōu)化,使得在NPU上的推理速度進(jìn)一步突破。

4、算法線

最后到應(yīng)用層,工業(yè)領(lǐng)域所需要的深度學(xué)習(xí)算法,往往以超高效率、多模態(tài)為主要特征。這類算法的開發(fā)訓(xùn)練難度不低,企業(yè)往往無法自行研發(fā)。為了讓工業(yè)級的AI算法普惠行業(yè),飛槳提供面向產(chǎn)業(yè)應(yīng)用的跨模態(tài)通用語義表示技術(shù),開源開放覆蓋多領(lǐng)域的工業(yè)級模型庫。

截至目前,飛槳平臺支持80多個產(chǎn)業(yè)實踐中長期總結(jié)和打磨的主流模型,同時開源開放100多個預(yù)訓(xùn)練模型,搭配大量工具和服務(wù)層的能力,構(gòu)成適合產(chǎn)業(yè)應(yīng)用的算法+工具+服務(wù)綜合工具箱。

每一條必須要跑過的路,飛槳都愿意和有能力比國際競品多跑一段距離。累計起來,構(gòu)成了世界AI框架領(lǐng)域,唯一的“工業(yè)過線者”。

產(chǎn)業(yè)級,三個筆畫簡單的字里,孕育了多個領(lǐng)域?qū)σ褬O限的突破,對未知世界的憧憬和洞察。

一圈漣漪

目前,飛槳深度學(xué)習(xí)平臺的開源開放,已累計服務(wù)了150多萬開發(fā)者,擁有超過6.5萬企業(yè)用戶、在定制化訓(xùn)練平臺上發(fā)布了16.9萬個模型,真實推動了中國AI技術(shù)的標(biāo)準(zhǔn)化、自動化和模塊化,加快產(chǎn)業(yè)應(yīng)用步伐。

在從深度學(xué)習(xí)到產(chǎn)業(yè)級開發(fā)平臺的第一層漣漪之后,飛槳的能量震蕩到廣袤的產(chǎn)業(yè)世界與開發(fā)者群落,形成了第二層堅強(qiáng)有力的漣漪。

在接下來的第二篇里,我們將追溯工業(yè)革命的漣漪——飛槳向產(chǎn)業(yè)實踐和開發(fā)者群落中的投射與嘗試。

各行業(yè)的案例、大量真實場景的凝結(jié)、實踐中的問題與解答,都在飛槳與這個秋天的相遇和成長。

作為產(chǎn)業(yè)AI引擎的飛槳,要在颯颯風(fēng)聲中,讓世界聽到它的轟鳴聲。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-10-16
工業(yè)革命的秋之漣漪(一):百度飛槳&AI引擎
幸運的是,互聯(lián)網(wǎng)、云計算、大數(shù)據(jù),再到AI的一系列發(fā)展,基本已經(jīng)讓第四次工業(yè)革命的首要問題產(chǎn)生了共識:這次全球行動注定由智能化來指揮,以深度學(xué)習(xí)為代表的第三次AI崛起,將為各行業(yè)生產(chǎn)力再次飛躍提供原動

長按掃碼 閱讀全文