詳解十余項(xiàng)AI前沿技術(shù)!開(kāi)發(fā)者必打卡的Create 2019百度大腦論壇

“技術(shù)前沿,覆蓋面廣,這是一場(chǎng)全程無(wú)槽點(diǎn)的分論壇”

“技術(shù)講解詳實(shí),落地案例充分,是一場(chǎng)‘物超所值’的分論壇”……

7月3日下午,“Baidu Create 2019”百度 AI開(kāi)發(fā)者大會(huì)百度大腦論壇如期舉行。在上午主論壇中,百度首席技術(shù)官王海峰正式發(fā)布百度大腦5.0,實(shí)現(xiàn)了歷史上最具跨越性升級(jí),在算法突破、計(jì)算架構(gòu)升級(jí)的基礎(chǔ)上,實(shí)現(xiàn)AI算法、計(jì)算架構(gòu)和應(yīng)用場(chǎng)景的融合創(chuàng)新,成為軟硬一體AI大生產(chǎn)平臺(tái)。



(百度首席技術(shù)官王海峰)

奪人眼球的“機(jī)械臂倒蓋碗茶”、任性的“中英自由說(shuō)”、智能語(yǔ)音芯片“百度鴻鵠”…都給觀眾留下深刻印象,一下拉近了AI科技和人之間的距離。這背后又隱藏著哪些頂尖技術(shù)?百度大腦5.0何以稱之為軟硬一體的AI大生產(chǎn)平臺(tái)?下午場(chǎng)滿滿“技術(shù)范兒”的百度大腦論壇一一揭曉。

語(yǔ)音、視覺(jué)、語(yǔ)言與知識(shí) AI算法創(chuàng)新并駕齊驅(qū)

重磅升級(jí)后的百度大腦5.0打通了從基礎(chǔ)層的深度學(xué)習(xí)技術(shù)到通用AI能力、應(yīng)用技術(shù)方案,再到定制化模型,以及最終的部署和集成,整個(gè)人工智能產(chǎn)業(yè)化應(yīng)用落地的全部流程,實(shí)現(xiàn)了AI技術(shù)的標(biāo)準(zhǔn)化、自動(dòng)化和模塊化。

一直引領(lǐng)行業(yè)創(chuàng)新的百度大腦語(yǔ)音技術(shù)此次亮出在語(yǔ)音識(shí)別、語(yǔ)音合成、遠(yuǎn)場(chǎng)語(yǔ)音交互芯片方面的成績(jī)單。百度語(yǔ)音技術(shù)部高級(jí)總監(jiān)高亮介紹,識(shí)別方面,百度提出流式多級(jí)的截?cái)嘧⒁饬δP蚐MLTA,這是國(guó)際上首次實(shí)現(xiàn)局部注意力建模超越整句的注意力模型,也是國(guó)際上首次實(shí)現(xiàn)在線語(yǔ)音大規(guī)模使用注意力模型。SMLTA在大幅提升識(shí)別速度的同時(shí),也提高了識(shí)別準(zhǔn)確率。在輸入法有效產(chǎn)品相對(duì)準(zhǔn)確率提升15%,音箱有效產(chǎn)品相對(duì)準(zhǔn)確率提升20%。合成方面,針對(duì)現(xiàn)階段面臨風(fēng)格遷移、音色模擬和情感擬人的三大挑戰(zhàn),百度推出語(yǔ)音合成技術(shù)Meitron,可以將語(yǔ)音中的音色、風(fēng)格、情感等要素映射到不同的子空間,在使用時(shí),不同要素可以任意組合,靈活的控制合成語(yǔ)音的風(fēng)格。同時(shí)降低語(yǔ)言合成門(mén)檻,僅需20句話就可以制作一個(gè)人的專屬聲音。



(百度語(yǔ)音技術(shù)部高級(jí)總監(jiān)高亮)

對(duì)于落地應(yīng)用正在端側(cè)呈現(xiàn)出巨大需求,百度大腦語(yǔ)音團(tuán)隊(duì)研發(fā)出一款針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音交互打造的芯片——百度鴻鵠芯片。鴻鵠芯片的設(shè)計(jì),變革傳統(tǒng)芯片設(shè)計(jì)方法,遵循“軟件定義芯片”的全新設(shè)計(jì)思路。該芯片采用雙核HiFi4架構(gòu),2.8M大內(nèi)存,臺(tái)積電40nm工藝,在此硬件規(guī)格上,100mw左右平均工作功耗,即可支持遠(yuǎn)場(chǎng)語(yǔ)音交互核心的陣列信號(hào)處理和語(yǔ)音喚醒能力。同時(shí),按照車(chē)規(guī)級(jí)標(biāo)準(zhǔn)打造使鴻鵠芯片可滿足極嚴(yán)格的需求,將為車(chē)載語(yǔ)音交互,以及智能家居等場(chǎng)景帶來(lái)更大想象力。鴻鵠芯片流片的同時(shí),即實(shí)現(xiàn)了量產(chǎn)。

百度視覺(jué)技術(shù)在2019年各大國(guó)際賽事中開(kāi)啟“開(kāi)掛”模式,在前不久結(jié)束的CVPR上分別在視頻理解、人臉活體、車(chē)輛REID等領(lǐng)域獲得第一,上半年在NTRIE2019、ICME2019、ICDAR2019、DWAN2019等比賽中也屢屢?jiàn)Z冠。百度視覺(jué)技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān)吳中勤介紹,5G時(shí)代,越來(lái)越多物理設(shè)備將連接到高可靠、低延時(shí)的網(wǎng)絡(luò)空間,這將徹底改變?nèi)藗兣c環(huán)境及設(shè)備的交互方式。本次全新發(fā)布視覺(jué)語(yǔ)義化平臺(tái)2.0,正在推進(jìn)視覺(jué)技術(shù)由“看清看懂”向“交互”進(jìn)行升級(jí)。視覺(jué)語(yǔ)義化平臺(tái)2.0在交互升級(jí)和軟硬件結(jié)合兩大方面實(shí)現(xiàn)突破。



(百度視覺(jué)技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān)吳中勤)

交互升級(jí)包含一體化人機(jī)交互系統(tǒng)和大場(chǎng)景物理世界交互系統(tǒng)。簡(jiǎn)單而言,一體化人機(jī)交互系統(tǒng)是人與機(jī)器、虛擬環(huán)境的自然交互與融合,該系統(tǒng)適用于實(shí)現(xiàn)AR特效的直播、小視頻、特效小程序等場(chǎng)景,已應(yīng)用于百度多款視頻App。大場(chǎng)景物理世界交互系統(tǒng)是將視覺(jué)定位與AR技術(shù)突破性結(jié)合,實(shí)現(xiàn)大范圍的虛擬信息與物理世界的精準(zhǔn)疊加,從而建立起AI時(shí)代全新的交互系統(tǒng)。目前,軟硬件結(jié)合可以滿足應(yīng)用場(chǎng)景更高效的視覺(jué)計(jì)算,以及更低延時(shí)的體驗(yàn),同時(shí)能保護(hù)數(shù)據(jù)隱私。百度視覺(jué)方面的軟硬件結(jié)合主要聚焦于模型壓縮平臺(tái)PaddleSlim、多模態(tài)FaceID開(kāi)發(fā)組件以及軟硬件一體解決方案AI相機(jī)三部分。FaceID覆蓋設(shè)備量已超1200萬(wàn)臺(tái)。

視覺(jué)語(yǔ)義化平臺(tái)2.0更新了許多先進(jìn)的感知技術(shù),也讓機(jī)器人技術(shù)實(shí)現(xiàn)新突破。百度三維視覺(jué)首席科學(xué)家楊睿剛介紹,機(jī)器人就是一個(gè)智能體,除了感知技術(shù),智能體需要決策和動(dòng)作相關(guān)的技術(shù),實(shí)現(xiàn)從環(huán)境感知到主動(dòng)感知。目前,百度研究的智能體技術(shù)主要集中在自動(dòng)駕駛Apollo、工程機(jī)械和服務(wù)機(jī)器人三大方面。上午主論壇中引人關(guān)注的機(jī)械臂“茶博士”不僅能說(shuō)會(huì)道,還完成了傳統(tǒng)的長(zhǎng)嘴壺倒茶工作,其背后依靠的正是服務(wù)機(jī)器人方案?;诎俣?D視覺(jué),機(jī)器人可以對(duì)茶杯的位置進(jìn)行檢測(cè)和追蹤。通過(guò)機(jī)器人運(yùn)動(dòng)規(guī)劃和控制,機(jī)械臂可以對(duì)工作空間進(jìn)行碰撞檢測(cè),避開(kāi)障礙物;實(shí)時(shí)規(guī)劃運(yùn)動(dòng)后,可自動(dòng)生成倒茶軌跡;隨后,感知水流變化,實(shí)時(shí)調(diào)整倒茶位置。語(yǔ)音語(yǔ)義聯(lián)動(dòng)技術(shù)解析,更是讓機(jī)器人像“人”一般,聽(tīng)得懂,說(shuō)得好,做得準(zhǔn)。



(百度三維視覺(jué)首席科學(xué)家楊睿剛)

在語(yǔ)言和知識(shí)技術(shù)方面,百度大腦也公布了一系列創(chuàng)新和突破。百度AI技術(shù)平臺(tái)體系執(zhí)行總監(jiān)吳甜向介紹,百度設(shè)計(jì)并實(shí)現(xiàn)了知識(shí)增強(qiáng)的語(yǔ)義理解框架——ERNIE,具備可持續(xù)學(xué)習(xí)能力,核心模型能力不斷提升。目前,ERNIE累計(jì)學(xué)習(xí)了超10億知識(shí),全面刷新中文NLP任務(wù)的指標(biāo),在百度眾多產(chǎn)品應(yīng)用中提升效果。機(jī)器同傳方面也有最新進(jìn)展,在翻譯過(guò)程中對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)的聯(lián)合詞向量編碼技術(shù),可解決多輪翻譯一致性和連貫性問(wèn)題的語(yǔ)篇翻譯模型等,結(jié)合先進(jìn)的語(yǔ)音技術(shù),百度大腦實(shí)現(xiàn)了高準(zhǔn)確、低時(shí)延的機(jī)器同傳技術(shù)。



(百度AI技術(shù)平臺(tái)體系執(zhí)行總監(jiān)吳甜)

知識(shí),能幫助AI更深度地理解真實(shí)世界。在主論壇中,王海峰用近期熱映的音樂(lè)紀(jì)錄片《大河唱》,形象展示了融合百度知識(shí)圖譜技術(shù)的視頻語(yǔ)義理解能力。該技術(shù)通過(guò)對(duì)視頻的多模態(tài)知識(shí)解析,在多元異構(gòu)知識(shí)圖譜上建立關(guān)聯(lián),并通過(guò)計(jì)算推理,建立對(duì)視頻的深度語(yǔ)義理解。

此外,吳甜還正式發(fā)布行業(yè)知識(shí)圖譜平臺(tái)和智能創(chuàng)作平臺(tái)2.0。行業(yè)知識(shí)圖譜平臺(tái)旨在滿足各行各業(yè)構(gòu)建和應(yīng)用知識(shí)圖譜來(lái)幫助推進(jìn)智能化的需求,行業(yè)知識(shí)圖譜平臺(tái)基于領(lǐng)先的知識(shí)圖譜核心技術(shù),提供智能高效的知識(shí)生產(chǎn)流程、低成本啟動(dòng)和跨行業(yè)遷移的能力,幫助產(chǎn)業(yè)開(kāi)發(fā)者定制行業(yè)知識(shí)圖譜并應(yīng)用。全新的智能創(chuàng)作平臺(tái)集成了實(shí)時(shí)熱點(diǎn)追蹤、關(guān)聯(lián)豐富素材,已經(jīng)具有全面的創(chuàng)作輔助能力,可輕松解決傳統(tǒng)內(nèi)容創(chuàng)作面臨的問(wèn)題,全流程助力創(chuàng)作者,吳甜也預(yù)告了10月份將進(jìn)行邀測(cè)的多模態(tài)自動(dòng)創(chuàng)作功能。目前,百度已構(gòu)建百度大腦·語(yǔ)言與知識(shí)技術(shù)開(kāi)放平臺(tái),不僅有豐富的基礎(chǔ)技術(shù),還形成了包括智能創(chuàng)作平臺(tái)在內(nèi)的翻譯開(kāi)放平臺(tái)、UNIT平臺(tái)、知識(shí)圖譜構(gòu)建與應(yīng)用平臺(tái)共四大應(yīng)用級(jí)平臺(tái),為不同領(lǐng)域提供百度領(lǐng)先的語(yǔ)言與知識(shí)技術(shù)。

夯實(shí)基礎(chǔ)實(shí)力 聚焦AI計(jì)算 挖掘數(shù)據(jù)價(jià)值

百度大腦5.0不僅包含算法層面創(chuàng)新,在算力方面也實(shí)現(xiàn)重大突破。近年來(lái),算法對(duì)算力需求增長(zhǎng)近300,000倍,而芯片的計(jì)算性能僅提升30倍,兩者之間存在巨大鴻溝。

百度副總裁侯震宇為現(xiàn)場(chǎng)觀眾分享了百度新一代AI計(jì)算架構(gòu)。面對(duì)AI計(jì)算的挑戰(zhàn),需要能夠從端到端來(lái)提供AI計(jì)算能力,這要求計(jì)算系統(tǒng)從舊有的對(duì)海量數(shù)據(jù)處理能力、對(duì)IO高峰值的追求,轉(zhuǎn)變?yōu)闈M足AI訓(xùn)練功能方面IO密集、計(jì)算密集、通信密集的需求,和AI推理功能方面大吞吐和低延遲的需求。



(百度副總裁侯震宇)

侯震宇認(rèn)為,面對(duì)即將到來(lái)的AI+5G時(shí)代,計(jì)算將無(wú)處不在。真正的計(jì)算會(huì)發(fā)生在設(shè)備(Device)、邊緣(Edge)和云(Cloud)中,因而D-E-C場(chǎng)景將會(huì)是接下來(lái)需要重點(diǎn)研究的問(wèn)題;與此同時(shí),包括芯片之間、系統(tǒng)之間、設(shè)備之間的互相連接,將幫助不同場(chǎng)景中的計(jì)算連接在一起,產(chǎn)生更大的計(jì)算力。

底層的芯片和上層的應(yīng)用之間,還需要操作系統(tǒng)承接。王海峰認(rèn)為,深度學(xué)習(xí)框架就是智能時(shí)代的操作系統(tǒng)。百度自研的國(guó)內(nèi)唯一功能完備的深度學(xué)習(xí)平臺(tái)“飛槳”就是中國(guó)自己的“AI操作系統(tǒng)”。主論壇中,正式宣布百度飛槳與華為麒麟芯片深度對(duì)接,全球領(lǐng)先的端側(cè)AI芯片和深度學(xué)習(xí)平臺(tái),將聯(lián)合為端側(cè)AI提供最強(qiáng)勁算力、打造最好的深度學(xué)習(xí)運(yùn)行效率。

對(duì)于飛槳,很多開(kāi)發(fā)者都非常熟悉?,F(xiàn)場(chǎng)百度深度學(xué)習(xí)技術(shù)平臺(tái)部總監(jiān)馬艷軍詳細(xì)介紹了飛槳的五大核心優(yōu)勢(shì)。在核心框架層面,飛槳同時(shí)支持動(dòng)態(tài)圖與靜態(tài)圖,兼顧了靈活性與效率;飛槳提供了70多個(gè)官方的、達(dá)到工業(yè)級(jí)應(yīng)用效果的模型;飛槳支持大規(guī)模的分布式訓(xùn)練以及端到端的部署;對(duì)于中國(guó)開(kāi)發(fā)者,飛槳提供系統(tǒng)的深度學(xué)習(xí)技術(shù)服務(wù),有非常全面的中文支持。馬艷軍現(xiàn)場(chǎng)還表示,技術(shù)界“奧斯卡”,已成功舉辦15年的經(jīng)典賽事“2019百度之星”即日起開(kāi)始報(bào)名,其中百度之星的編程賽是飛槳核心框架開(kāi)發(fā)的任務(wù);百度之星開(kāi)發(fā)賽,則是基于飛槳的目標(biāo)檢測(cè)任務(wù)。



(百度深度學(xué)習(xí)技術(shù)平臺(tái)部總監(jiān)馬艷軍)

為了降低建模的成本,提高建模的效率,并降低對(duì)大數(shù)據(jù)的依賴,減少人工的干預(yù),百度開(kāi)發(fā)了AutoDL自動(dòng)化建模技術(shù)。論壇上,百度大數(shù)據(jù)實(shí)驗(yàn)室主任浣軍正式發(fā)布AutoDL 3.0,從設(shè)計(jì)、遷移和適配三方面進(jìn)行全面升級(jí),并分享了多個(gè)實(shí)際案例,目前已通過(guò)飛槳正式開(kāi)源。



(百度大數(shù)據(jù)實(shí)驗(yàn)室主任浣軍)

源于產(chǎn)業(yè)實(shí)踐的深度學(xué)習(xí)平臺(tái)飛槳同時(shí)亦正在反哺產(chǎn)業(yè)。百度地圖事業(yè)部總經(jīng)理李瑩以交通領(lǐng)域?yàn)槔?,介紹百度地圖基于飛槳提升了ETA的開(kāi)發(fā)、調(diào)試的便捷性和訓(xùn)練效率,完成了天級(jí)別的百億級(jí)數(shù)據(jù)訓(xùn)練;提升了ETA的部署和預(yù)測(cè)性能,支撐了天級(jí)別的百億次調(diào)用。ETA是地圖路線規(guī)劃的主要特征,也是用戶出行決策的主要參考因素。對(duì)于用戶而言,飛槳賦能的百度地圖ETA可以實(shí)現(xiàn)通行時(shí)間智能預(yù)估,在出行前便可提前預(yù)知路況,避開(kāi)擁堵時(shí)段、了解擁堵時(shí)長(zhǎng)、躲避擁堵路線,合理規(guī)劃出行時(shí)間。



(百度地圖事業(yè)部總經(jīng)理李瑩)

數(shù)據(jù)是AI時(shí)代的核心生產(chǎn)資料,當(dāng)前大數(shù)據(jù)產(chǎn)業(yè)發(fā)展中面臨數(shù)據(jù)資產(chǎn)安全性和數(shù)據(jù)價(jià)值發(fā)掘成本高兩大問(wèn)題。百度大數(shù)據(jù)部高級(jí)總監(jiān)郭謝介紹,百度點(diǎn)石大數(shù)據(jù)技術(shù)開(kāi)放平臺(tái)作為國(guó)內(nèi)第一家落地的大數(shù)據(jù)iPaaS平臺(tái),聚焦大數(shù)據(jù)產(chǎn)業(yè)發(fā)展過(guò)程中的安全和效率兩大問(wèn)題。同時(shí),點(diǎn)石具有三大核心特性,包含安全的數(shù)據(jù)融合加工環(huán)境、多層次開(kāi)放的可定制組件,以及功能一體化的大數(shù)據(jù)開(kāi)發(fā)平臺(tái),可以幫助開(kāi)發(fā)者安全、高效地進(jìn)行大數(shù)據(jù)價(jià)值的發(fā)掘。百度希望通過(guò)點(diǎn)石加速大數(shù)據(jù)的生態(tài)發(fā)展,幫助開(kāi)發(fā)者深度發(fā)掘數(shù)據(jù)價(jià)值,點(diǎn)石成金。



(百度大數(shù)據(jù)部高級(jí)總監(jiān)郭謝)

AI算法、計(jì)算架構(gòu)和應(yīng)用場(chǎng)景的融合創(chuàng)新的百度大腦5.0已成為軟硬一體 AI大生產(chǎn)平臺(tái)。百度大腦論壇下午近三個(gè)小時(shí)的分享,僅僅是百度大腦技術(shù)的“冰山一角”。除了頂級(jí)的技術(shù),百度大腦仍將不斷開(kāi)放賦能,目前已經(jīng)開(kāi)放210余項(xiàng)領(lǐng)先的AI技術(shù)能力,平臺(tái)的調(diào)用次數(shù)同比增長(zhǎng)108%,定制化平臺(tái)模型的數(shù)量都在飛速增長(zhǎng),平臺(tái)上的開(kāi)發(fā)者數(shù)量已經(jīng)達(dá)到了130萬(wàn)。王海峰表示,“授人魚(yú)不如授人以漁”,百度研發(fā)頂尖的AI技術(shù),也致力于開(kāi)放頂尖的AI技術(shù)。百度大腦5.0,助力各行各業(yè)的產(chǎn)業(yè)開(kāi)發(fā)者,加速產(chǎn)業(yè)智能化。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-07-03
詳解十余項(xiàng)AI前沿技術(shù)!開(kāi)發(fā)者必打卡的Create 2019百度大腦論壇
“技術(shù)前沿,覆蓋面廣,這是一場(chǎng)全程無(wú)槽點(diǎn)的分論壇”“技術(shù)講解詳實(shí),落地案例充分,是一場(chǎng)‘物超所值’的分論壇”…

長(zhǎng)按掃碼 閱讀全文