語(yǔ)音能力引擎日均調(diào)用100億次,百度大腦“喚醒”了什么?

剛剛結(jié)束的百度大腦語(yǔ)音能力引擎論壇,向外界披露了這樣一個(gè)數(shù)字:百度大腦的語(yǔ)音能力引擎日均調(diào)用量已經(jīng)超過(guò)100億次。

對(duì)照國(guó)內(nèi)8.54億的網(wǎng)民規(guī)模,平均每個(gè)人要和百度大腦的語(yǔ)音能力引擎每天接觸12次,場(chǎng)景涉及輸入法的語(yǔ)音輸入、智能音箱的語(yǔ)音對(duì)話、百度地圖的語(yǔ)音導(dǎo)航、與各種機(jī)器人的有趣互動(dòng)……無(wú)論是覆蓋范圍還是使用頻次,早已超過(guò)99%的互聯(lián)網(wǎng)服務(wù)。

可能在不少人的印象里,人工智能還是遙不可及的新事物,百度大腦用數(shù)據(jù)告訴了我們這樣一個(gè)事實(shí):人工智能并不遙遠(yuǎn),甚至已經(jīng)是生活中不可或缺的一部分。

01 日均調(diào)用100億次的背后

如果僅僅盯著數(shù)字來(lái)看,100億不可謂不龐大,也奠定了百度大腦語(yǔ)音應(yīng)用規(guī)模第一的成績(jī)。但比數(shù)字本身更有價(jià)值的是,百度大腦如何做到語(yǔ)音能力引擎日均調(diào)用量超過(guò)100億次的規(guī)模,以及100億次的語(yǔ)音到底“喚醒”了什么?

第一個(gè)問(wèn)題的答案是開(kāi)放。截止到目前,百度大腦已經(jīng)開(kāi)放了云、端、芯的全棧全場(chǎng)景語(yǔ)音開(kāi)放能力,廣泛應(yīng)用于文娛、金融、政務(wù)等多個(gè)行業(yè)和場(chǎng)景,開(kāi)發(fā)者們只需要一個(gè)簡(jiǎn)單的調(diào)用,即可為產(chǎn)品接入百度大腦的智能語(yǔ)音能力。

而從百度大腦語(yǔ)音能力引擎論壇傳遞的消息來(lái)看,百度大腦的語(yǔ)音引擎全新發(fā)布和升級(jí)了14大產(chǎn)品內(nèi)容,包括基于百度鴻鵠語(yǔ)音芯片的4款硬件模組、開(kāi)發(fā)板,針對(duì)智能家居、智能車載、智能IoT設(shè)備等端到端的軟硬一體遠(yuǎn)場(chǎng)語(yǔ)音交互場(chǎng)景解決方案,語(yǔ)音自訓(xùn)練平臺(tái)、呼叫中心語(yǔ)音解決方案的升級(jí),以及6個(gè)在線語(yǔ)音合成精品音庫(kù)和5個(gè)離線語(yǔ)音合成精品音的發(fā)布。

簡(jiǎn)單來(lái)說(shuō),百度大腦已經(jīng)為語(yǔ)音能力引擎打造了一條應(yīng)用落地的生態(tài)鏈,而且生態(tài)鏈所覆蓋的場(chǎng)景和能力還在不斷拓展。

至于第二個(gè)問(wèn)題的答案,不妨先來(lái)看三個(gè)具體的應(yīng)用案例。

創(chuàng)維AIoT研究院產(chǎn)品經(jīng)理李凱在演講中談及創(chuàng)維和百度大腦的合作,在百度鴻鵠語(yǔ)音芯片等軟硬件的賦能下,創(chuàng)維為產(chǎn)品增加了語(yǔ)音交互能力,涉及2500萬(wàn)臺(tái)的電視裝機(jī)量,用戶只需要一個(gè)語(yǔ)音指令就能找到自己喜歡的電視節(jié)目,讓電視的交互從遙控器直接進(jìn)化到智能語(yǔ)音時(shí)代。

北京子杰寶貝科技有限公司將百度大腦的語(yǔ)音能力引擎帶到了醫(yī)療領(lǐng)域,之前60%的醫(yī)護(hù)人員每天要花費(fèi)45分鐘到90分鐘的時(shí)間填寫(xiě)表單數(shù)據(jù)。依靠百度大腦的語(yǔ)音識(shí)別、自然語(yǔ)言處理等技術(shù),醫(yī)護(hù)人員如今用語(yǔ)音就能完成表單的錄入。

善行智能在百度大腦的智能語(yǔ)音技術(shù)、智能OCR識(shí)別、智能物體識(shí)別等技術(shù)的加持下,打造了可以智能識(shí)別障礙物、物品、錢(qián)幣等物體,并通過(guò)語(yǔ)音播報(bào)給用戶的小Q智能導(dǎo)盲眼鏡,幫助盲人群體獨(dú)立的認(rèn)知世界。

誠(chéng)然,“100億次日均調(diào)用量”的背后是人工智能落地應(yīng)用的生態(tài)圈,為合作伙伴帶來(lái)了轉(zhuǎn)型的契機(jī),為醫(yī)護(hù)人員解決了工作的痛點(diǎn),也讓盲人群體感受到了AI的溫暖。而這些僅僅是百度大腦技術(shù)賦能的冰山一角。

02 AI賽道中的“學(xué)霸”人設(shè)

除了智能語(yǔ)音的落地應(yīng)用,百度大腦還在不斷推動(dòng)語(yǔ)音技術(shù)的發(fā)展,比如百度語(yǔ)音首席架構(gòu)師賈磊提出的基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)和語(yǔ)音識(shí)別一體化端到端建模技術(shù),相較于傳統(tǒng)基于數(shù)字信號(hào)處理的麥克陣列算法,新技術(shù)的錯(cuò)誤率降低了30%以上,并且已經(jīng)被集成到最新發(fā)布的百度鴻鵠芯片中。

身為人工智能賽道里的“學(xué)霸”,百度大腦并非是擅長(zhǎng)語(yǔ)音技術(shù)的偏科生,而是一個(gè)典型的“別人家的孩子”。

在烏鎮(zhèn)智庫(kù)出品的《全球人工智能發(fā)展報(bào)告》中,專門(mén)羅列了中國(guó)AI專利ToP 10的企業(yè),百度以935件的專利數(shù)量,毋庸置疑的成了榜單上的頭名選手,并與騰訊、阿里等同一陣營(yíng)的玩家們拉開(kāi)了較大的差距。

在國(guó)際權(quán)威研究機(jī)構(gòu)Forrester發(fā)布的計(jì)算機(jī)視覺(jué)公有云報(bào)告中,在百度大腦的AI視覺(jué)技術(shù)加持下,百度智能云處于中國(guó)市場(chǎng)“領(lǐng)導(dǎo)者”領(lǐng)域最上方 ,在數(shù)據(jù)、解決方案、應(yīng)用場(chǎng)景、管理能力等多維度領(lǐng)先于阿里云、騰訊云等廠商。另一份《IDC MarketScape:2019中國(guó)AI云服務(wù)市場(chǎng)廠商評(píng)估》中,憑借在能力和市場(chǎng)兩個(gè)維度的優(yōu)異表現(xiàn),百度智能云同樣位居領(lǐng)導(dǎo)者象限最上方。

在4月初結(jié)束的ICME人臉106關(guān)鍵點(diǎn)檢測(cè)比賽中,百度大腦力壓阿里、華為、美團(tuán)、中科大等選手拿到冠軍;6月份的CVPR 2019上,百度大腦又在視頻理解與分析、目標(biāo)檢測(cè)、圖像超分辨、智能城市車輛識(shí)別、人臉&人體檢測(cè)等領(lǐng)域斬獲了10項(xiàng)冠軍;11月份的ICCV 2019上,百度大腦視覺(jué)團(tuán)隊(duì)以mAP值57.13%的成績(jī)奪得人臉檢測(cè)的冠軍,超過(guò)第二名0.47%……

如果從時(shí)間上看,2016年百度大腦對(duì)外開(kāi)放至今不過(guò)三年時(shí)間,縱然離不開(kāi)百度長(zhǎng)期的技術(shù)積累,這么短時(shí)間里的全面開(kāi)花無(wú)疑佐證了百度大腦的“學(xué)霸”人設(shè)。這樣的成長(zhǎng)速度與百度的技術(shù)基因、工程師文化等不無(wú)關(guān)系,或許還有另外一重原因。

2017年的時(shí)候,就有人將中美在人工智能賽道中的角色比作星球大戰(zhàn)里的Luke和Darth Vader,甚至為雙方進(jìn)行了“戰(zhàn)力”對(duì)比:美國(guó)AI公司的數(shù)量比中國(guó)高出1.82倍,流向美國(guó)的資金份額比中國(guó)高1.54倍,美國(guó)的AI人才庫(kù)亦是中國(guó)的2.01倍……美國(guó)在人工智能領(lǐng)域的強(qiáng)力基礎(chǔ),有賴于Google、亞馬遜、IBM、微軟等先行者,中國(guó)人工智能的擔(dān)子自然就落到了BAT身上。

某種程度上說(shuō),“學(xué)霸”百度大腦還肩負(fù)著抹平中美AI力量鴻溝的義務(wù),而從一系列國(guó)際賽事上的表現(xiàn)、國(guó)際權(quán)威機(jī)構(gòu)的認(rèn)證來(lái)看,百度大腦也是中國(guó)AI領(lǐng)域當(dāng)之無(wú)愧的頭雁,構(gòu)建起AI的全棧技術(shù)布局,平等的賦能每一位開(kāi)發(fā)者,將是百度大腦現(xiàn)在和未來(lái)身體力行的使命所在。

03 百度大腦在持續(xù)刷新

百度首席技術(shù)官王海峰在百度大腦語(yǔ)音能力引擎論壇講到進(jìn)化和賦能:“AI技術(shù)的進(jìn)化和產(chǎn)業(yè)賦能正向循環(huán),相互促進(jìn),AI在應(yīng)用場(chǎng)景中不斷進(jìn)化?!笨梢岳斫鉃檫@就是百度大腦對(duì)自身的使命,也促使百度大腦在持續(xù)“刷新”。

猶記得2016年的百度世界大會(huì)上,李彥宏用了相當(dāng)長(zhǎng)的篇幅來(lái)講述這個(gè)“新概念”,彼時(shí)還只是記住了“百度大腦”這個(gè)名字,至于會(huì)產(chǎn)生什么樣的影響,恐怕很多人并沒(méi)有答案。然而短短三年的時(shí)間里,百度大腦早已成了生活中的一部分,百度輸入法的語(yǔ)音輸入,入住酒店時(shí)的刷臉認(rèn)證,農(nóng)田里的遙感無(wú)人機(jī),工廠里的智能零件分揀……在那些看得到和看不見(jiàn)的生產(chǎn)生活場(chǎng)景中,都有著百度大腦的身影。

截止到目前,百度大腦已經(jīng)開(kāi)放了228項(xiàng)AI能力,擁有超過(guò)150萬(wàn)的開(kāi)發(fā)者用戶,當(dāng)年李彥宏對(duì)百度大腦的寄托已經(jīng)逐步實(shí)現(xiàn)。但百度大腦并沒(méi)有止步于此,在完成AI能力與應(yīng)用場(chǎng)景融合創(chuàng)新的第一步后,百度大腦在5.0升級(jí)時(shí)被定義為“軟硬一體的AI大生產(chǎn)平臺(tái)”,讓AI邁入產(chǎn)業(yè)世界與工業(yè)大生產(chǎn)進(jìn)行融合。

與之對(duì)應(yīng)的是,語(yǔ)音技術(shù)推出了風(fēng)格遷移的語(yǔ)音合成技術(shù),僅需20句話就可以制作一個(gè)人的專屬聲音;視覺(jué)方面形成了適用于不同應(yīng)用場(chǎng)景的技術(shù)矩陣,諸如車輛識(shí)別、物體識(shí)別、風(fēng)格轉(zhuǎn)化、人流量統(tǒng)計(jì)等等;語(yǔ)言與知識(shí)方面,構(gòu)建了世界上最大的多元異構(gòu)知識(shí)圖譜……除了技術(shù)能力的刷新,百度還將算力、算法和數(shù)據(jù)打通,以百度智能云為依托,以百度大腦為核心,以飛槳為基礎(chǔ)底座,為各行各業(yè)的智能化轉(zhuǎn)型升級(jí)提供強(qiáng)有力的支撐。

市場(chǎng)的反映也印證了百度的正確性,僅以百度大腦人臉公有云服務(wù)為例,公有云日均調(diào)用量超過(guò)1億,開(kāi)發(fā)者超過(guò)13萬(wàn),用戶使用規(guī)模穩(wěn)居業(yè)界第一。并且百度大腦在人臉識(shí)別領(lǐng)域積累了1000多家合作伙伴,落地了超過(guò)10萬(wàn)個(gè)項(xiàng)目,形成了豐富、完整的人臉產(chǎn)品矩陣。

同樣“刷新”的還有百度大腦的人才體系。就在不久前,著名的計(jì)算機(jī)和大數(shù)據(jù)理論領(lǐng)域?qū)<襃effrey Vitter加入到百度研究院顧問(wèn)委員會(huì),美國(guó)俄勒岡大學(xué)教授竇德景也加盟百度研究院擔(dān)任大數(shù)據(jù)實(shí)驗(yàn)室主任。從世界級(jí)科學(xué)家組成的頂級(jí)智囊,到百度龐大的一線工程師,百度大腦在為行業(yè)賦能,驅(qū)動(dòng)AI走進(jìn)工業(yè)大生產(chǎn)時(shí)代的同時(shí),也在不斷將AI技術(shù)做透、做精、做深。

“刷新”是百度大腦的底色,也是持續(xù)修煉內(nèi)功讓AI走進(jìn)真實(shí)世界的態(tài)度。

04 寫(xiě)在最后

從2016到2019,人們對(duì)AI的理解已經(jīng)不再局限于圍棋大戰(zhàn),可在談?wù)揂I的時(shí)候,核心算法上的瓶頸仍然是不少開(kāi)發(fā)者的錐心之痛。百度大腦就像一個(gè)扛著挑戰(zhàn)一路向前的勇士,在每一個(gè)關(guān)鍵節(jié)點(diǎn)上為業(yè)界開(kāi)辟出一條條新路。

讀懂了這一點(diǎn),語(yǔ)音能力引擎的100億次日均調(diào)用,注定只是百度大腦的一個(gè)小目標(biāo),因?yàn)椤白岄_(kāi)發(fā)者平等地獲取AI能力”這條路本就沒(méi)有終點(diǎn)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2019-11-29
語(yǔ)音能力引擎日均調(diào)用100億次,百度大腦“喚醒”了什么?
剛剛結(jié)束的百度大腦語(yǔ)音能力引擎論壇,向外界披露了這樣一個(gè)數(shù)字:百度大腦的語(yǔ)音能力引擎日均調(diào)用量已經(jīng)超過(guò)100億次。

長(zhǎng)按掃碼 閱讀全文