人臉識別技術再刷記錄!AIG如何讓百度AI基石越來越穩(wěn)?

摘要:最近,百度憑借自主研發(fā)的人臉檢測深度學習算法PyramidBox,在世界最權威的人臉檢測公開評測集WIDERFACE的“Easy”、“Medium”和“Hard”三項評測子集中均獲得冠軍,也打破了歷史

最近,百度憑借自主研發(fā)的人臉檢測深度學習算法PyramidBox,在世界最權威的人臉檢測公開評測集WIDER FACE的“Easy”、“Medium”和“Hard”三項評測子集中均獲得冠軍,也打破了歷史記錄。這個結果,不讓人意外。在AI基礎技術上,百度一直都在不斷證明自己,已不是第一次拿獎。

百度AI技術已成“屠榜”高手

就拿人臉檢測技術來說,百度早在2015年就通過DenseBox算法,刷新了FDDB和LFW兩個公開數據集的記錄,保持世界第一并保持了一年。人臉識別技術是機器視覺與生物識別的交叉技術,人臉檢測是人臉識別的第一步——在圖片或者視頻中找到人臉并精確定位。如果是自拍照自然很容易,目前美圖軟件、智能手機都可以做到,不過很多照片或者視頻中有大量的人像,而且可能有姿態(tài)、遮擋、光線、環(huán)境、模糊、失焦等不利因素,因此人臉檢測并不容易,要機器達到人眼水平很難。

目前,在所有AI技術中,人臉識別應用最為廣泛。自拍、解鎖、實名制校驗,甚至支付,都能用人臉識別來完成,治安、零售、教育、公益等行業(yè)也在大量應用人臉識別技術。百度在人臉檢測上的不斷打破記錄,體現(xiàn)的是百度AI技術的實力,人臉技術只是百度AI技術的一部分(當然,也是很重要的一個技術),百度在自然語言處理、機器視覺、語音交互、知識圖譜、機器翻譯等AI技術上都有布局,且成績斐然。

今年2月,美國《麻省理工科技評論》揭曉的2018年“全球十大突破性技術”(10 Breakthrough Technologies 2018)中,百度成為唯一入選的中國公司,被列為實時語音翻譯領域的關鍵玩家,百度也是唯一一家連續(xù)三年入選該榜單的中國公司。

同樣是在2月,百度自然語言處理(NLP)團隊研發(fā)的V-Net模型以46.15的Rouge-L得分登上微軟的MS MARCO(Microsoft MAchine Reading COmprehension)機器閱讀理解測試排行榜首。機器閱讀理解可以讓機器更好地理解一段文字。比如百度可以通過這個技術來理解用戶的搜索內容或者問題,從一個頁面定位答案并經過總結、提煉、歸納后進行展示。這個賽事更大的意義在于,其運用的訓練數據是微軟在產品實踐中收集來的問題和答案,直接從互聯(lián)網文本與產品實踐問題中訓練出的模型,應用價值更強。

這些成績,都證明了百度AI技術的實力。而所有這些技術都出自于百度AIG。去年3月,百度宣布整合包括NLP、KG、IDL、Speech、Big Data等在內的百度核心技術,組成百度AI技術平臺體系(AIG),任命百度副總裁王海峰為AI技術平臺體系(AIG)總負責人。現(xiàn)在看來,百度整合多個技術到一個體系,的確讓人才的聚集,技術的管理,以及技術的進步更集中。

然而“屠榜”并不是AIG的目的

算法或者技術拿到獎項,打破記錄,或者登陸榜單,是百度大力支持AI技術的結果,也是百度AI技術實力的證明,但它不是百度AIG存在的唯一目的。AIG不是一個只會研發(fā)底層技術來拿獎的實驗室,而是支撐百度業(yè)務,特別是AI相關業(yè)務的技術平臺。

王海峰曾闡述過他對技術的理解:

“AI的發(fā)展最終還是要回到‘服務用戶需求’的本質,這是我們每一位人工智能的從業(yè)者都需要銘記在心的。利用好人工智能來服務好我們的用戶和客戶,以及更好地打磨AI能力來推動各行各業(yè)的效率提升,是每一位人工智能領域從業(yè)者的期望。”

具體來說,百度AIG在大力研發(fā)基礎AI技術的同時,還強調AI技術的應用和開放。

首先,在應用層面重視技術的實用性。比如百度人臉技術,就被百度金融應用到與泰康保險、中國農業(yè)銀行的合作項目用于人臉核身;烏鎮(zhèn)、武夷山等旅游景區(qū)、北京首都機場、南方航空在廣州白云機場的貴賓休息室,應用人臉識別來提升旅客游客的體驗。自然語言處理技術的應用廣泛性無需贅言,語音已是DuerOS的基礎,百度已經與TCL、創(chuàng)維、海爾、海信等諸多家電巨頭,以及華為、小米等手機巨頭戰(zhàn)略合作,知識圖譜也成為百度搜索結果中的重要內容。

抓基礎技術的同時,也在強化對應用技術的投入。今年1月,百度研究院在硅谷成立了兩個新實驗室,一個是商業(yè)智能,另一個是機器人與自動駕駛,不再是此前IDL這樣的純技術實驗室,不再只做深度學習、大數據這樣的底層技術研發(fā)。從名字就可以看出,百度AIG對應用技術的重視。

百度去年在AI開發(fā)者大會上就已經提出要Bring AI to Life,讓AI落地到生活場景中的口號,將AI技術落地到實際業(yè)務成為未來的大方向,也與AIG重視“技術驅動產品,產品牽引技術”的策略符合。

其次,在開放層面重視前沿技術的共享。百度AI技術很強大,但不獨享,而是開放給行業(yè)。百度目前已經開放了包括語音、圖像、自然語言處理、視頻、增強現(xiàn)實、知識圖譜、智能數據七個方向,共計90余項AI技術能力,成為國內最大的AI開放平臺。百度還將其深度學習框架PaddlePaddle全面開源,讓開發(fā)者可以擁抱AI。3月23日,百度在北京舉辦了第一期AI加速器DEMO DAY,百度AI加速器旨在幫助創(chuàng)業(yè)者擁抱AI,是百度AI開放的一個舉措。

可以看出,百度AIG的技術路線圖是很清晰,也是很有前瞻性的。一方面,作為百度的基礎技術,AI底層技術不能依賴任何第三方,要自力更生,因此百度AIG在基礎技術上大力投入,不斷在技術上突破、獲獎也證明了這一策略的效果。另一方面,AIG將技術落地到業(yè)務中,讓業(yè)務牽引技術發(fā)展,開放的核心目的也會要促進AI技術在各行各業(yè)的落地。當然,反過來,應用和開放也可以鞏固百度AI技術的領先地位。

AIG如何一年內成為百度基座?

百度的基石是什么?相信很多人的答案都是:技術。而技術是由什么構成的?一行行抽象的代碼后面是工程師等技術人的投入,正是因為此,負責百度核心技術的AIG可以說是百度的基座。當百度將多個分散在各個部門的技術部門,以及百度研究院整合到一起時,許多人都看不清百度為什么要這樣做,現(xiàn)在看來好處已經很明顯,讓百度的AI技術沿著更實用的方向研發(fā),加速AI技術落地。AIG在短時間內穩(wěn)步成長,原因是多方面的。

綜合各種信息來看,目前百度AIG的技術研究部門大致可以劃分成百度研究院和應用技術部門,其中百度研究院的目標很單一,就是要做AI底層技術的研發(fā)——不過與谷歌X實驗室等不同的是,它的探索性更低,實用性更高。應用技術部門,則負責技術的應用與落地。今年百度研究院又增加了兩大實驗室,目前已有五大實驗室,實現(xiàn)了對AI基礎和主要應用技術的全覆蓋。

AIG不斷龐大的背后是百度在研發(fā)上的堅決投入,李彥宏去年曾表示,百度每年在研發(fā)上投入上百億 ,占總收入15%,這個占比位列行業(yè)第一。

在人才引進層面,李彥宏對于技術人才一直有“周公吐哺天下歸心”的廣納良才的策略,除了給很好的待遇外,更重要的是很有吸引力的研發(fā)環(huán)境。百度AIG也在不斷吸納世界頂尖人才,比如百度研究院目前擁有六位世界級科學家。同時百度擁有廣泛的AI應用場景,比如搜索、信息流、DuerOS、無人車,都是AI強相關業(yè)務。頂尖的技術團隊和作為技術落地沃土的產品和業(yè)務,相互作用下形成了一個良性的的正向循環(huán)鏈條,讓百度AI能夠持續(xù)“進化”。

在產業(yè)環(huán)境層面,AI爆發(fā)已是不爭事實,2018年AI正在落地到各行各業(yè),但AI技術研發(fā)卻需要持續(xù)進行,機器在大多數時候還是不如人類,技術進步空間很大。不過,在AI產業(yè)爆發(fā)后,行業(yè)對AI人才的急缺已經讓更多技術人才開始重視學習AI,前不久南京大學甚至成立了AI學院,培養(yǎng)AI專業(yè)人才。在這樣的環(huán)境下, 百度AIG基于本身的吸引力,要獲取優(yōu)秀人才會越來越容易。而此前百度在AI技術上多年已久的布局,也讓它有了厚積薄發(fā)的能力。

不難看出,百度“先技術后場景”的思路正在改變,逐漸成為技術研發(fā)與場景應用雙管齊下,保持技術優(yōu)勢的同時,推動AI技術商業(yè)化。而高速運轉狀態(tài)的AIG,正在給百度源源不斷地提供前沿、實用和有競爭力的技術,同時幫助百度AI技術落地和開放。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-03-30
人臉識別技術再刷記錄!AIG如何讓百度AI基石越來越穩(wěn)?
摘要:最近,百度憑借自主研發(fā)的人臉檢測深度學習算法PyramidBox,在世界最權威的人臉檢測公開評測集WIDERFACE的“Easy”、“Medium”和“Hard”三項評測子集中均獲得冠軍,也打破

長按掃碼 閱讀全文