百度NLP十年布局:翻越認(rèn)知智能高山,架起通往現(xiàn)實(shí)世界的橋

自然語(yǔ)言處理(NLP)是人工智能皇冠上的一顆明珠。

這樣的說(shuō)法在人工智能領(lǐng)域流傳許久,現(xiàn)實(shí)中發(fā)生的卻是這樣一幕:計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等領(lǐng)域紛紛跑出了多個(gè)獨(dú)角獸,沖刺IPO的消息也時(shí)常出現(xiàn)。可作為“皇冠上的明珠”的NLP領(lǐng)域,卻難見(jiàn)獨(dú)角獸的影子,大多數(shù)創(chuàng)業(yè)者還停留在A輪或B輪融資。

NLP如何走出困局?

在NLP領(lǐng)域深耕十年,被稱作“中國(guó)NLP燈塔”的百度給出了切實(shí)的答案。8月25日舉行的百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì)上,伴隨著一系列語(yǔ)言與知識(shí)產(chǎn)品的發(fā)布與升級(jí),百度NLP的全景布局和鉆研了十幾年的核心技術(shù)一一亮相。

01 翻越認(rèn)知智能的高山

把時(shí)間調(diào)回一個(gè)多月前的ACL 2020。

作為NLP領(lǐng)域最負(fù)盛名的國(guó)際頂會(huì),ACL 2020收到了3429 篇論文投稿,其中被接收的779篇論文中有185 篇來(lái)自中國(guó)大陸,占比僅次于美國(guó)。距離2010年首次有中國(guó)科技企業(yè)的論文入選ACL,僅僅過(guò)去了10年時(shí)間。

除了論文數(shù)量的逐年增長(zhǎng),中國(guó)NLP學(xué)者的面孔也陸續(xù)在ACL上出現(xiàn)。

2013年,百度CTO王海峰成為ACL歷史上首位華人主席;2014 年,同樣來(lái)自百度的吳華出任 ACL 程序委員會(huì)主席;2015年,哈工大教育部語(yǔ)言語(yǔ)音重點(diǎn)實(shí)驗(yàn)室主任李生教授獲得 ACL 終身成就獎(jiǎng);2016 年,百度的趙世奇當(dāng)選 ACL 秘書(shū)長(zhǎng);2018年,ACL 宣布創(chuàng)建亞太區(qū)域分會(huì),王海峰擔(dān)任創(chuàng)始主席;2020 年,百度組織了 ACL 大會(huì)上首場(chǎng)同聲傳譯研討會(huì)……

以百度為代表的中國(guó)力量在NLP的世界舞臺(tái)上不斷出彩,本身就是一種話語(yǔ)權(quán)的象征,而左右話語(yǔ)權(quán)的核心因素正是學(xué)術(shù)成就。

僅以百度為例,過(guò)去十年是百度NLP高速增長(zhǎng)的十年,在NLP領(lǐng)域摘得了包括國(guó)家科技進(jìn)步獎(jiǎng)在內(nèi)的20多個(gè)獎(jiǎng)項(xiàng),在30多項(xiàng)國(guó)際競(jìng)賽中奪得冠軍,累計(jì)發(fā)表的學(xué)術(shù)論文超過(guò)300篇,專(zhuān)利申請(qǐng)高達(dá)2000多項(xiàng)。

其中最具代表性的無(wú)疑就是百度的語(yǔ)義理解技術(shù)與平臺(tái)文心(ERNIE)。

2019年12月,基于ERNIE 2.0改進(jìn)的模型在權(quán)威榜單GLUE上首次突破90大關(guān),超越人類(lèi)基線3個(gè)點(diǎn),獲得全球第一;3個(gè)月后的人工智能頂級(jí)會(huì)議AAAI 2020上,NLP預(yù)訓(xùn)練領(lǐng)域入選論文《ERNIE 2.0: A Continual Pre-Training Framework for Language Understanding》被選為Oral展示;2020年的世界人工智能大會(huì)上,ERNIE有了中文名字“文心”,并一舉斬獲最高獎(jiǎng)項(xiàng)SAIL獎(jiǎng)(Super AI Leader,卓越人工智能引領(lǐng)者)。

學(xué)術(shù)上的一系列成就,意味著百度已經(jīng)站在了NLP研究的最前沿,成為中國(guó)NLP領(lǐng)域的領(lǐng)軍者,并與谷歌、微軟一道被視為“全球AI三巨頭”。

可對(duì)于百度來(lái)說(shuō),技術(shù)的價(jià)值絕不只是在象牙塔中“高光”,在NLP的學(xué)術(shù)領(lǐng)域走進(jìn)殿堂的同時(shí),也在循序推進(jìn)應(yīng)用場(chǎng)景中的落地。

剛剛結(jié)束的百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì)上,第一個(gè)重磅產(chǎn)品就是在NLP核心技術(shù)基礎(chǔ)上延展開(kāi)發(fā)的文心ERNIE——語(yǔ)義理解技術(shù)與平臺(tái),針對(duì)傳統(tǒng)NLP定制常見(jiàn)的成本高、耗時(shí)長(zhǎng)、可迭代性差等短板,文心集成了優(yōu)秀的預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開(kāi)發(fā)套件和平臺(tái)化服務(wù),提供了一站式NLP開(kāi)發(fā)與服務(wù)。

這或許就是百度給出的答案,想要推動(dòng)NLP的產(chǎn)業(yè)應(yīng)用,僅僅在學(xué)術(shù)上站在山巔還不夠,需要的是幫助整個(gè)行業(yè)翻越認(rèn)知智能的高山,以低門(mén)檻、低成本、高效率的平臺(tái)優(yōu)勢(shì)加速NLP的落地。

正如百度CTO王海峰所言,百度“致力于更好的與學(xué)術(shù)界、產(chǎn)業(yè)界攜手,推動(dòng)語(yǔ)言與知識(shí)技術(shù)發(fā)展,進(jìn)而推動(dòng)人工智能技術(shù)持續(xù)進(jìn)步,為產(chǎn)業(yè)持續(xù)升級(jí)、社會(huì)經(jīng)濟(jì)高質(zhì)量發(fā)展貢獻(xiàn)力量?!?/p> 123下一頁(yè)>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2020-08-26
百度NLP十年布局:翻越認(rèn)知智能高山,架起通往現(xiàn)實(shí)世界的橋
自然語(yǔ)言處理(NLP)是人工智能皇冠上的一顆明珠。這樣的說(shuō)法在人工智能領(lǐng)域流傳許久,現(xiàn)實(shí)中發(fā)生的卻是這樣一幕:計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等領(lǐng)域紛紛跑出了多個(gè)獨(dú)角獸,沖刺IPO的消息也時(shí)常出現(xiàn)。

長(zhǎng)按掃碼 閱讀全文