Facebook大中華區(qū)平臺(tái)合作負(fù)責(zé)人濮冠楠:人工智能-規(guī)模與創(chuàng)新

8月30-31日,由中國(guó)高科技行業(yè)門戶OFweek維科網(wǎng)、高科會(huì)主辦,OFweek人工智能網(wǎng)承辦的2018中國(guó)(上海)國(guó)際人工智能展覽會(huì)暨OFweek(第二屆)人工智能產(chǎn)業(yè)大會(huì)在上海成功舉辦。本次大會(huì)用全新視角透析行業(yè)動(dòng)態(tài),解讀人工智能領(lǐng)域本年度海內(nèi)外最值得關(guān)注的學(xué)術(shù)與研發(fā)進(jìn)展,與數(shù)千位人工智能領(lǐng)域的國(guó)際知名企業(yè)高層、行業(yè)資深專家、專家分析機(jī)構(gòu)等數(shù)千位精英進(jìn)行多方分析與探討。

在30日AI技術(shù)專場(chǎng)主論壇上,F(xiàn)acebook大中華區(qū)平臺(tái)合作負(fù)責(zé)人濮冠楠發(fā)表了《人工智能-規(guī)模與創(chuàng)新》主題演講,介紹了Facebook在龐大的數(shù)據(jù)量下如何通過(guò)AI技術(shù)做到內(nèi)容審核、質(zhì)量監(jiān)控。同時(shí)共享了開源深度學(xué)習(xí)工具Torch、人工智能系統(tǒng)WIT.AI、深度學(xué)習(xí)框架PYTORCH、模塊化的深度學(xué)習(xí)框架caffe2。

Facebook大中華區(qū)平臺(tái)合作負(fù)責(zé)人濮冠楠

以下為Facebook大中華區(qū)平臺(tái)合作負(fù)責(zé)人濮冠楠的現(xiàn)場(chǎng)演講內(nèi)容,OFweek人工智能網(wǎng)作了不改變?cè)獾恼砗途庉嫞?/strong>

大家好,首先謝謝今天有這個(gè)機(jī)會(huì)可以跟大家簡(jiǎn)單的介紹一下Facebook在人工智能領(lǐng)域目前的一些進(jìn)展和所做的一些嘗試。

我叫濮冠楠,在新加坡,主要是負(fù)責(zé)Facebook在大中華地區(qū)的和開發(fā)者合作關(guān)系。我今天簡(jiǎn)單地先介紹一下。

Facebook在大家正常理解來(lái)說(shuō),其實(shí)就是一家軟件公司,是做移動(dòng)的APP開發(fā)的。當(dāng)然在這一點(diǎn)上我們確實(shí)擁有一些規(guī)?;容^大的應(yīng)用,比如說(shuō)目前Facebook本身在全球的月活躍超過(guò)22億人,我們有一個(gè)比較完整的產(chǎn)品矩陣,整體產(chǎn)品矩陣的用戶數(shù)其實(shí)是非常大的。在這些內(nèi)容里,我們是如何做一些比如說(shuō)內(nèi)容的審核、質(zhì)量的監(jiān)控,以及各種各樣的一些技術(shù)的支持呢?其實(shí)在很多基層架構(gòu)的底層里,我們使用了很多AI的一些技術(shù)支持。我們看簡(jiǎn)單的一些例子,可以簡(jiǎn)單的介紹一些具體飛速的AI是如何在我們的產(chǎn)品里使用的。大家可以看到最左邊這個(gè)例子,其實(shí)是Facebook的messenger。在這個(gè)例子里,我們看到其實(shí)它是聊天機(jī)器人,那就是messenger facebook。

相對(duì)于我們作為一個(gè)用戶來(lái)說(shuō),聊天機(jī)器人可以去搜索、定制自己的旅行,相當(dāng)于一個(gè)智能聊天的方式,去選擇制定自己的旅行計(jì)劃,同時(shí)我們可以給一些推薦。在這里大家可以看到,在預(yù)訂過(guò)程過(guò)程中,它的AI的部分其實(shí)是相當(dāng)于我們有一個(gè)nlp語(yǔ)義學(xué)習(xí)的分析,這一部分是Facebook的一個(gè)架構(gòu)。同時(shí)大家也可能知道在Facebook上我們有很多這種視頻的內(nèi)容,包括我們最近在Facebook推出的展示視頻的頁(yè)面。人工智能在這方面的應(yīng)用,其實(shí)就是說(shuō)在用戶把視頻上傳到Facebook之后,可以快速的生成一個(gè)視頻的預(yù)覽,大概三秒鐘,這其實(shí)也是通過(guò)人工智能來(lái)實(shí)現(xiàn)的。除此之外,大家可以看到這是我們做的另一個(gè)嘗試,就是在大概一年半之前Facebook正式開放了自己的相機(jī)平臺(tái),相當(dāng)于我們有一個(gè)開放的相機(jī)平臺(tái),開發(fā)者也可以在這個(gè)平臺(tái)上開發(fā)自己想要做的一些實(shí)踐,在這邊我們可以看到這個(gè)平面識(shí)別技術(shù),實(shí)際上就是通過(guò)AI的底層技術(shù)來(lái)打造的。

最后我們包括除AR、相機(jī)之外,虛擬現(xiàn)實(shí)的技術(shù)很多也會(huì)在底層中應(yīng)用。同時(shí)Facebook面對(duì)的一個(gè)比較大的挑戰(zhàn)也是剛才我說(shuō)過(guò),因?yàn)镕acebook本身的用戶數(shù)在全球范圍內(nèi)是一個(gè)比較龐大的規(guī)模,在這個(gè)時(shí)候我們生成的虛假用戶的內(nèi)容其實(shí)非常多,我們很大程度上是依靠人工智能快速的去識(shí)別、刪除這些內(nèi)容。

接下來(lái)我簡(jiǎn)單介紹一下Facebook在人工智能領(lǐng)域做的一些嘗試,我們?cè)谘芯款I(lǐng)域做的嘗試大概可以分為幾點(diǎn)。我們最新的一個(gè)在人工智能領(lǐng)域方面的嘗試,就是推出了pitch。它上線到現(xiàn)在已經(jīng)將近18個(gè)月時(shí)間了,在上線時(shí)間都是一個(gè)自然的增長(zhǎng)。在2016年1月上線之后,大概18個(gè)月之前,大家可以看到它其實(shí)有一個(gè)非常大的自然的增長(zhǎng),尤其是在引用庫(kù)里、在研究方面,它的增長(zhǎng)速度其實(shí)是非常快。那什么是pitch?其實(shí)就是我們低于人工智能推出的一個(gè)比較更偏向于快速部署的一個(gè)AI的forMark。

pitch可能比較適合做一些研究方面的應(yīng)用,因?yàn)镕acebook畢竟自己也是一個(gè)基于用戶的APP開發(fā)者,所以我們內(nèi)部另外一個(gè)比較大的forMark叫咖啡兔,咖啡兔更像是一個(gè)偏向于應(yīng)用層面的forMark。大家如果知道咖啡兔的話,它幾乎是用在我們那公司內(nèi)部的所有的應(yīng)用里邊,就是我們自己的移動(dòng)的APP都會(huì)使用咖啡兔的forMark,也就是說(shuō)在這種情況下,我們大概可以知道咖啡兔的使用的量級(jí)是非常大的,每天咖啡兔使用的量級(jí)大概是200兆一次,同時(shí)因?yàn)樗搽S著Facebook的APP預(yù)載在手機(jī)里,相當(dāng)于在全世界大概會(huì)有10億到20億的手機(jī)已經(jīng)會(huì)使用到咖啡兔的技術(shù)。之前可能很多forMark的模型不能互相混用,將來(lái)我們希望打造開放的架構(gòu)規(guī)范,尤其是研究開發(fā)人員互相交換意見的時(shí)候可以更加簡(jiǎn)單,模型遷移的成本可能也會(huì)更低一些。

最終我們也在今年年初的時(shí)候把這3個(gè)forMark共同的整合到一起,我們把這個(gè)平臺(tái)的名字稱為pitch1.0,相當(dāng)于把這三個(gè)架構(gòu)綜合放到一起了,目前我們希望這一個(gè)架構(gòu)可以更多的滿足開發(fā)研究方面的需求。同時(shí)這方面其實(shí)也歸功很多我們合作伙伴的大力的支持,比如說(shuō)微軟還有亞馬遜。

接下來(lái)我簡(jiǎn)單的講一下,具體我們的應(yīng)用層面,對(duì)于Facebook來(lái)說(shuō),我們是如何通過(guò)參數(shù)去訓(xùn)練大數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)?

簡(jiǎn)單來(lái)說(shuō),我們是有三個(gè)具體的應(yīng)用的層面,如果從應(yīng)用層面來(lái)分區(qū)的話,第一個(gè)大的就是視覺,就是Facebook在視覺方面是如何做AI的,同時(shí)就是語(yǔ)意語(yǔ)言分析。最后是推理。

我簡(jiǎn)單的介紹一下這三個(gè)部分,到底我們具體做了一些嘗試是怎么樣的。

在具體的圖像視覺識(shí)別的時(shí)候,我們其實(shí)一直會(huì)有一個(gè)嘗試,從2012年最開始的,我們可能識(shí)別出來(lái)的只能是最左邊圖像里邊的一個(gè)人。大概五年之后,在2017年的時(shí)候,我們的識(shí)別已經(jīng)可以說(shuō)相對(duì)的比較準(zhǔn)確,可以識(shí)別出具體的每個(gè)物體,相當(dāng)于我們識(shí)別出來(lái)這個(gè)物體多大程度上可以確信。不光是包括這個(gè)識(shí)別的準(zhǔn)確率,同時(shí)因?yàn)楹芏鄷r(shí)候大家應(yīng)用的場(chǎng)景,包括圖像識(shí)別,其實(shí)是在移動(dòng)設(shè)備里,就是在手機(jī)里,那識(shí)別的效率其實(shí)也是更加重要的一部分。

這是我們?cè)谛史矫娴淖龅囊粋€(gè)提升,在2017年之前的時(shí)候,如果我們做肢體的具體識(shí)別的時(shí)候,識(shí)別度是比較低的。那在過(guò)了一年之后,在2018年的時(shí)候,我們就有一個(gè)非常高的準(zhǔn)確率,同時(shí)即使在手機(jī)上運(yùn)行的速度也是比較快的。

幾乎非常實(shí)時(shí)的準(zhǔn)確的對(duì)整個(gè)人的身體建模,同時(shí)進(jìn)行識(shí)別。具體我們是如何做到這些的呢?其實(shí)是通過(guò)海量的數(shù)據(jù)來(lái)進(jìn)行connive。因?yàn)橛脩粼诎阉恼掌蟼鞯紽acebook的時(shí)候,一般會(huì)做一些標(biāo)簽,如何把標(biāo)簽跟照片聯(lián)系在一起,是一個(gè)我們進(jìn)行模型訓(xùn)練的一個(gè)方式。在Facebook上目前公開設(shè)置高標(biāo)貼的照片超過(guò)35億,比如說(shuō)我們?cè)赾onnive之前可能在看實(shí)物,如果我們看照片來(lái)識(shí)別的話,只能識(shí)別出實(shí)物。之后經(jīng)過(guò)這些模型的確定之后,我們大概可以分析出來(lái)它具體實(shí)物的種類、包括地標(biāo)、具體的地標(biāo)名字,這些其實(shí)都是可以通過(guò)我們的圖形圖像的connive來(lái)做到的。

在一個(gè)就是語(yǔ)言,為什么語(yǔ)言對(duì)像Facebook這樣規(guī)模的公司比較重要。因?yàn)镕acebook上的人數(shù)其實(shí)是非常多的,即使Facebook自己的APP就超過(guò)22億,而且同時(shí)用戶在上面使用的語(yǔ)言的種數(shù)也很多,可能也會(huì)超過(guò)200多種世界各地不同的語(yǔ)言。這些東西對(duì)我們都是一個(gè)很大的挑戰(zhàn),如何給用戶提供正確的翻譯,很簡(jiǎn)單的說(shuō),可能要我們自動(dòng)地提供機(jī)器的翻譯,這是其中一種。同時(shí)我們也希望盡力、盡量的可能支持全世界各種各樣不同的語(yǔ)言。

我剛才可能說(shuō)過(guò)Facebook自己支持的語(yǔ)言,就是我們?cè)赨I界面上支持200種不同的語(yǔ)言,但是其實(shí)在世界各地大家使用的語(yǔ)言的種類,就是比較活躍的語(yǔ)言其實(shí)可能會(huì)超過(guò)6000種。我們?cè)谡Z(yǔ)言語(yǔ)音識(shí)別的時(shí)候,會(huì)有一些簡(jiǎn)單的嘗試,就是說(shuō)我們會(huì)把不同的語(yǔ)言做一個(gè)嵌入,就是把不同的語(yǔ)音打包進(jìn)行學(xué)習(xí)。

最后一部分我簡(jiǎn)單介紹一下,就是在推理這個(gè)環(huán)節(jié)我們做了一些嘗試。因?yàn)橛?jì)算機(jī),尤其包括人工智能可以做到的事情,就是幫我們?cè)谌粘I钪薪鉀Q很多問題。這方面其實(shí)每個(gè)公司都會(huì)有自己很多不同的嘗試。我們嘗試一些簡(jiǎn)單的例子,如果我們看到一個(gè)圖片,不僅僅是做一個(gè)識(shí)別,我們可以進(jìn)一步地推理,它可以做到事情是什么?比如說(shuō)在不同的場(chǎng)景里,我們可以設(shè)置一個(gè)指令問浴缸的顏色是什么?我們通過(guò)機(jī)器學(xué)習(xí)可以算出來(lái),它可能是淡灰色。是否可以準(zhǔn)確視覺識(shí)別出房間大概功能是什么?就可能需要更深層次的一個(gè)東西,就是推理的功能。

當(dāng)然大家可能也知道google在圍棋方面有很多的嘗試,F(xiàn)acebook其實(shí)也有自己在圍棋這邊的一些嘗試,我們?cè)谶@邊做了蠻多的事情,我們?cè)贏I圍棋這邊的嘗試。同時(shí)我們也會(huì)使用一些游戲來(lái)做一些connivement,這邊的畫面就是一個(gè)已經(jīng)比較老的游戲,叫做星期爭(zhēng)霸。大家可以看到在這邊就相當(dāng)于一個(gè)比較生動(dòng)的模型,相當(dāng)于你可以看到在游戲中的兩個(gè)種族的對(duì)戰(zhàn)。如果在機(jī)器在connive之前,我們可以看到右邊的這個(gè)部隊(duì),它的作戰(zhàn)并沒有一個(gè)很清晰的邏輯,經(jīng)過(guò)機(jī)器訓(xùn)練之后,可以發(fā)現(xiàn)他們其實(shí)有自己的布局,包括布陣,這些其實(shí)都是并沒有很多輔導(dǎo),大部分都是它自己在訓(xùn)練領(lǐng)悟的。

Facebook在AI方面的投入還是蠻大的,尤其是目前的話,我們會(huì)在底層做很多不同的嘗試,剛才說(shuō)過(guò)的不同的應(yīng)用的層級(jí),視覺、語(yǔ)言、推理工具,我們都會(huì)有不同的freemarke,而這些都是開源的,大家可以直接在我們的網(wǎng)站上下載到這些不同的東西自己使用。

最后一點(diǎn),就是對(duì)于這種層級(jí)的公司,如果要做一些AI的研究或者一些相關(guān)的東西的話,大規(guī)模的數(shù)據(jù)中心都是必不可少的。在這邊Facebook也在全世界各地建立了自己的數(shù)據(jù)中心,我們的數(shù)據(jù)中心的設(shè)計(jì)圖紙也是開源的,如果大家有興趣的話,也可以去研究一下我們的數(shù)據(jù)中心是如何設(shè)計(jì)的。那今天我的演講環(huán)節(jié)就到此為止,謝謝大家!

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2018-09-08
Facebook大中華區(qū)平臺(tái)合作負(fù)責(zé)人濮冠楠:人工智能-規(guī)模與創(chuàng)新
8月30-31日,由中國(guó)高科技行業(yè)門戶OFweek維科網(wǎng)、高科會(huì)主辦,OFweek人工智能網(wǎng)承辦的2018中國(guó)(上海)國(guó)際人工智能展覽會(huì)暨OFweek(第二屆)人工智能產(chǎn)業(yè)大會(huì)在上海成功舉辦。

長(zhǎng)按掃碼 閱讀全文