為什么相比芯片,我們更在意深度學習框架的中國化?

原標題:為什么相比芯片,我們更在意深度學習框架的中國化?

這兩天美國宣布對中興進行封鎖,可謂在科技圈掀起了從上到下的一股龍卷風。

4月16日美國商務部發(fā)布命令,禁止美國企業(yè)向中興通訊銷售元器件,時間長達7年。假如這一紙禁令真正生效,意味著中興通訊旗下全產業(yè)鏈所依靠的芯片等核心元件失去獲取渠道,基本意味著龐大的中興通訊將面臨無法繼續(xù)經營的最壞可能。

中興通訊股價隨之快速下跌,已相當于兩個跌停板,其美國供應商的股價在“禁令”發(fā)布后也遭遇不同程度的下跌。

19日,中國商務部新聞發(fā)言人高峰在新聞發(fā)布會上表示,美方行徑引起了市場對于美國貿易和投資環(huán)境的普遍擔憂。

隨著中美貿易戰(zhàn)延伸到科技領域,似乎一夜間我們又回憶起了缺失核心研發(fā)能力的恐懼?!叭毙局础鞭D瞬彌漫在輿論氛圍里,甚至關于“中國科技到底行不行”的討論又一次塵囂直上。

當然了,出問題就無限夸大其實并沒有太大意義??陀^來說,美國的芯片禁令無法持久,畢竟這背后涉及的美國本土產業(yè)鏈、利益群落與工作崗位非常龐大。一旦接連失去中國大客戶,美國引以為傲的科技產業(yè)本身就會撐不住。

另外我們需要認清的是,半導體行業(yè)今天的國際格局并不是幾個月,甚至幾年內造成的。而是整個半導體工業(yè)時代發(fā)展和遺留下來的產物。中國以及全世界更多市場的計算機、工業(yè)、通用電子系統(tǒng)上本土芯片占有率都是零。

事實上,中興這樣的中國企業(yè),在技術上的銳意進取是有目共睹的。但芯片研發(fā)制造能力的國際壟斷,是幾十年積累下來的產業(yè)現實,是大量的科技因素與市場封鎖、貿易規(guī)則制定綜合得出的結論。是一兩家公司,甚至是集合整個科技集群都難以改變的。

換句話說,中國科技公司面臨可能出現的困境,除了加強研發(fā)投入也沒有什么別的辦法。過去我們無法改寫,但今天我們能改變的東西,叫做未來。

就像幾十年前的半導體技術是核心中的核心。今天提起能改變未來世界的技術,AI絕對是當仁不讓。尤其值得注意的是,這個剛剛興起、充滿變化的技術領域里,中美之間的價值突圍和技術博弈其實更加激烈。

AI的國家戰(zhàn)略重要性是毋庸質疑的,而針對產業(yè)鏈上游核心技術的爭奪正在逐步呈現白熱化。假如我們希望若干年后整個產業(yè)界,甚至整個國家不會再因為一紙封鎖領而恐慌,那么AI這個戰(zhàn)場的基礎設施,才是真的不容有失。

或許對于大部分人來說,AI的底層之爭在今天還有些陌生,但它確實很可能像曾經的半導體一樣,產生新時代的世界科技格局壟斷效應。比如說每個AI開發(fā)者都會用到,所有AI應用產生的基礎——深度學習開發(fā)框架。

在這個普通人很陌生的領域,中國科技公司和萬千開發(fā)者,正在一點點刷新著中國科技的存在感。

被忽略的深度學習框架

芯片為什么重要?原因在于它是一切運算的基礎,是最后端的的東西,沒有它一切硬件都玩不轉。所以當壟斷形成,就能對其他經濟體的科技發(fā)展形成底層制約。

同樣的道理,在AI時代也體現在開發(fā)框架這件事上。我們知道,AI開發(fā)者不能每開發(fā)一個模型就從最底層重新來過,所以想要進行算法訓練、模型開發(fā)、應用部署,都必須在一定的開發(fā)平臺上來完成。AI發(fā)展到今天,這個平臺的角色主要依靠大學和企業(yè)提供的深度學習框架來扮演。

在中國,深度學習框架相對來說是一個科研和開發(fā)領域的事情,但在美國,產業(yè)界圍繞開發(fā)框架的爭奪戰(zhàn)早已經火星四溢。

比如說,很多美國媒體都認為,谷歌今天在云計算、硬件、語音助手、AI教學等業(yè)務中,全都展現出“TensorFlow First”的特點,用盡各種辦法將開發(fā)者引導至自己的開發(fā)平臺上,并且堅決不兼容其他開發(fā)框架。

而Facebook、微軟則對TensorFlow的封閉深惡痛絕,形成了以caffe、Python結盟形式的“反谷歌聯盟”,希望以兼容性和社群開放等優(yōu)勢,打破谷歌一騎絕塵的戰(zhàn)略格局。

對開發(fā)框架的重視,隱藏著科技企業(yè)和背后國家經濟體對AI未來的押注。試想無數應用都在自己的平臺上進行開發(fā),那么所有數據、算法創(chuàng)新和模型訓練過程就都留在了平臺當中。企業(yè)和平臺收獲的,是作為地基的產業(yè)地位。而國家經濟收獲的,是可以從源頭上控制其他經濟體AI應用的“上游效應”。

幸運的是,已經吃夠了“下游之苦”的中國,在深度學習框架這件事上并沒有落后。

為了解決當時主流開發(fā)框架僅支持但GPU應用,無法進行大規(guī)模數據處理的問題。百度從2013年就開始研發(fā)自己的深度學習框架PaddlePaddle,經過長期內部應用后,在2016年正式將其進行開源。

這也讓百度成為繼谷歌、Facebook、IBM之后,全球第四家、中國第一家開源深度學習開發(fā)框架的科技公司,從而讓中國在這個關鍵領域沒有陷入長期滯后。百度之后,國內的其他相關企業(yè)也紛紛在框架上展現動作,在AI之爭可能打響的前夜,中國產業(yè)壁壘的高度已和過去不再相同。

可能出現的中美AI對決中,開發(fā)框架或是軸心武器

就目前中國AI的整體行業(yè)氛圍而言,似乎普遍更關注AI“用”的一面,容易忽略在應用之前的開發(fā)與創(chuàng)新,以及為創(chuàng)新提供的基礎設施,是整個AI商業(yè)想象力的原點。

事實上,假如我們將中美兩國看做處于競比關系的兩個AI技術群落,那么深度學習框架的質量和接受度,很可能會影響到整個產業(yè)競賽的進程甚至結果。

或許可以從三個角度,來看為什么中國一定要有自己的深度學習框架,以及中國開發(fā)者為何更應該支持“國貨”。

1. 中國AI無法離開中文:我們知道,AI的一個重要領域是語言與對話的交互。那么未來在中國市場應用的,必然是基于中文的AI開發(fā)。但在NLP與語音交互、神經網絡翻譯等技術上,國外主流開發(fā)框架很少有中文數據集,也缺乏在中文領域的技術探索。如今來看,開發(fā)者想要開展這方面的工作,幾乎必須依賴PaddlePaddle這樣的國產框架所提供的開發(fā)基礎和數據集、文檔。

2. 產業(yè)鏈的安全風險:去年,谷歌的TensorFlow曾經被爆出重大安全漏洞。雖然沒有造成實質影響,但當時專家評估,類似的漏洞完全可以影響甚至摧毀所有基于該平臺開發(fā)出的AI模型。要知道AI大量涉及安防、識別、城市交通、公共服務等國家事務核心領域應用,這些應用如果在國外框架中開發(fā)運行,那么安全風險不言而喻。這個層面來看,百度開源PaddlePaddle這類的舉措,也是在AI與國家科技安全提供了更妥善的解決方案。

3. 產業(yè)應用需求不同:相比于美國,中國對AI開發(fā)這件事的需求其實有很大不同。比如說傳統(tǒng)企業(yè)多、開發(fā)者的應用需求大、商業(yè)期待迫切、開發(fā)人才處在發(fā)展階段。那么相比于前沿探索類的開發(fā),中國開發(fā)者更需要在開發(fā)框架提供高效、靈活的開發(fā)方案,以及快速部署、彈性學習的能力。這些因素當然是遠在天邊的歐美開發(fā)平臺不會考慮的,比如偏底層考慮的TensorFlow,就需要開發(fā)者考慮大量細碎問題,但PaddlePaddle就更偏重于高層開發(fā),強調開發(fā)者可以盡快投入應用。顯然,只有類似百度這樣深諳中國開發(fā)者需求和中國AI市場生態(tài)環(huán)境的企業(yè),才會進行針對性價值提供。

不難看出,基于應用性、安全性和中文開發(fā)的必然性,中國開發(fā)者都應該選擇“支持國貨”,而PaddlePaddle也可以說是目前最符合中國開發(fā)者需要和國情真實境況的開發(fā)框架。

但是有個問題要搞清楚:說一千道一萬,國貨必須足夠優(yōu)質才能讓開發(fā)者支持。好在,今天來看PaddlePaddle等平臺并沒有讓我們的愛國之心失望。

“國框”的進擊:從PaddlePaddle到中國AI并未缺席

確實在科技領域,“理性支持國貨”顯得尤為重要。畢竟不能為一些大局層面的考慮,犧牲貨真價實的成本與效率。好在從PaddlePaddle今天的成績來看,“國框”已經在很多層面上足可與歐美一較高下。

Caffe 的創(chuàng)始人賈楊清在評價PaddlePaddle時,也認同其在簡潔、靈活、快速等領域功力不俗,并且解決了Caffe早期的不少遺留問題。從技術邏輯到開發(fā)者的應用價值上,我們可以分為三層來評價PaddlePaddle的特點。

首先需要看到的是,在開發(fā)者需求的核心特性上PaddlePaddle已不落后:比如說PaddlePaddle的快捷流暢一直飽受好評,在RNN算法上其速度比主流框架快1-2倍,而且占用的顯存資源更少。

另外PaddlePaddle最開始就是為了解決大規(guī)模集群計算問題而生。所以相比TensorFlow來說,能給予開發(fā)者更多的可伸縮性與靈活性。比如其支持多種集群框架,可實現GPU集群資源的動態(tài)分配。這樣開發(fā)者會更快上手,更加容易貼近模型的應用化。

其次,我們可以看到PaddlePaddle已經帶來了一些功能上的獨特創(chuàng)新。在AI開發(fā)的世界,沒有點絕招顯然是不好出來混的,畢竟開發(fā)大牛們的眼光那叫一個挑剔。在強敵環(huán)伺的開發(fā)叢林里,功能獨創(chuàng)性確實很難,但好在“國框”已經有了進展。

比如說PaddlePaddle的最新版本fluid中,開發(fā)過程更加接近高級語言。這就保證了開發(fā)過程的透明化和可控,從而有效抵消了深度學習開發(fā)過程中的“黑箱問題”。讓開發(fā)者不再模模糊糊做開發(fā),這個能力是今天主流框架共同爭奪的,但PaddlePaddle已經不落人后。再比如說PaddlePaddle支持彈性的使用計算資源來完成深度學習訓練,根據計算需求來調節(jié)資源使用,這就節(jié)省了開發(fā)者的大量成本。

再有一個,也要看到今天的開發(fā)框架之爭絕對不僅僅是框架內部的技術矛盾。更多時候開發(fā)者要看重平臺的生態(tài)性、應用度以及商業(yè)前景。比如谷歌讓Facebook等公司忌憚的,其實是整個谷歌AI產業(yè)封閉起來的排他特征。

而在生態(tài)與商業(yè)價值層面,百度顯然給開發(fā)者提供了足夠優(yōu)質的選擇。圍繞PaddlePaddle,百度正在幾個領域搭建與開發(fā)者的緊密合作網絡,為硬件、無人駕駛、智能服務等主要市場實時注入發(fā)展動力。并且不斷輸出新的AI開發(fā)者培植方案,同時為開發(fā)者提供了快速進入商業(yè)世界的通道。

綜上所述,今天“國框”已經不能說是為了愛國而愛國的強硬選擇。在很多層面上,AI開發(fā)的自主、自有、自生態(tài),已經可以在中國這個世界第二大AI技術實體與市場獨立完成。也許我們并沒有想要爭奪什么,但沖出技術封鎖,可以說是一切關于未來想象的前提。

結束語:別是一風景

或許對于中美貿易戰(zhàn),以及可能的科技禁運等情況,我們還是有些過于敏感了。

誠然,硬件和底層技術有差距,是必須要承認的事實;但在新的領域,在爭奪未來的原點上,中國科技工作者、開發(fā)者以及無數企業(yè),一直都沒有停止奔跑。中美之間的差距,今天也在以肉眼可見的速度縮小。

對待中美科技之爭,更合理的方式或許是承認差距的同時,認清很多關鍵領域本土的并不比國外差。

沒有必要盲信,但也沒有必要盲目悲觀。國家自信這件事,在科技領域從來沒有比今天更真實過。

堅定支持國家和產業(yè)打造技術核心競爭力;開發(fā)者、資本和平臺有效組織產業(yè)聚合;營造更好的創(chuàng)新土壤,那么中國終有一天不會再被人牽著鼻子走。

星河流轉之后,或許別是一風景。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-04-21
為什么相比芯片,我們更在意深度學習框架的中國化?
原標題:為什么相比芯片,我們更在意深度學習框架的中國化?這兩天美國宣布對中興進行封鎖,可謂在科技圈掀起了從上到下的一股龍卷風。

長按掃碼 閱讀全文