除了Facebook人工智能研究部門(FAIR)之外,F(xiàn)acebook還設(shè)有一個(gè)名為應(yīng)用機(jī)器學(xué)習(xí)的部門。國外科技網(wǎng)站Backchannel主編史蒂芬·列維(Steven Levy)近日撰文揭秘了該部門的運(yùn)作,詳解人工智能是如何成為該社交網(wǎng)絡(luò)未來戰(zhàn)略不可或缺的一部分的。它在幫助給Facebook的產(chǎn)品服務(wù)帶來視覺、說話、理解等方面的功能,甚至還在幫助清理假消息。
在被要求領(lǐng)導(dǎo)Facebook的應(yīng)用機(jī)器學(xué)習(xí)(Applied Machine Learning,簡稱AML)部門,肩負(fù)利用AI改造全球最大的社交網(wǎng)絡(luò)的責(zé)任的時(shí)候,杰奎因·奎諾內(nèi)羅·坎德拉(Joaquin Qui?onero Candela)有些猶豫不定。
并不是說該西班牙出生的科學(xué)家,該自稱“機(jī)器學(xué)習(xí)(ML)研究者”的人,沒有見證過AI如何能夠幫助Facebook.自2012年加入該公司以來,他領(lǐng)導(dǎo)過公司廣告運(yùn)營的改革:利用ML技術(shù)來提高贊助廣告的相關(guān)性和有效性。更重要的是,在這個(gè)過程中,他鼓勵(lì)其部門的工程師使用AI,即便他們沒有接收過這種培訓(xùn),因此廣告部門人員整體上擁有更加豐富的機(jī)器學(xué)習(xí)技能。不過,他并不確定同樣的魔法在更加寬廣的Facebook平臺上也會奏效,畢竟上面數(shù)十億的人際連接依賴于較為模糊的價(jià)值觀,而不是依賴于可用來測量廣告的硬數(shù)據(jù)?!拔蚁胍_信是否能夠在上面創(chuàng)造價(jià)值?!彼缡钦劦剿臅x升。
不管是Facebook,Instagram還是Messenger,都由AI驅(qū)動
雖然心存疑惑,但坎德拉還是接掌了該職位。如今,將近兩年過后,他當(dāng)初的猶豫不決似乎很荒謬。
有多荒謬呢?上個(gè)月,坎德拉在紐約市的一個(gè)大會上面向工程師觀眾發(fā)表演講?!拔覍⒁l(fā)表一個(gè)強(qiáng)力的聲明?!彼娣Q,“Facebook今天沒有AI就無法生存。你可能不知道,每一次你使用Facebook、Instagram又或者M(jìn)essenger,你的體驗(yàn)都是由AI驅(qū)動的。”
去年11月,我造訪Facebook位于門洛帕克的總部,訪問坎德拉和他的部分團(tuán)隊(duì)成員,探秘AI如何突然之間成為了Facebook賴以生存的存在。截至目前,外界對于Facebook在AI領(lǐng)域的動作的關(guān)注主要集中在它世界一流的Facebook人工智能研究部門(FAIR),該部門由著名的神經(jīng)網(wǎng)絡(luò)專家雅恩·樂昆(Yann LeCun)領(lǐng)導(dǎo)。與谷歌、微軟、百度、亞馬遜和蘋果的AI部門一樣,F(xiàn)AIR是最受精英AI項(xiàng)目畢業(yè)生追捧的組織之一。在近期計(jì)算機(jī)視覺、聽覺甚至對話方面的技術(shù)進(jìn)展背后的數(shù)字神經(jīng)網(wǎng)絡(luò)領(lǐng)域,F(xiàn)AIR是取得突破性進(jìn)展最多的組織之一。不過,坎德拉的應(yīng)用機(jī)器學(xué)習(xí)部門(AML)是負(fù)責(zé)將FAIR和其它部門的研究成果整合到Facebook實(shí)際的產(chǎn)品當(dāng)中--以及負(fù)責(zé)驅(qū)使公司所有的工程師將機(jī)器學(xué)習(xí)技術(shù)整合到他們的工作當(dāng)中,這一點(diǎn)可能更為重要。
由于Facebook沒有AI就無法生存,它需要所有內(nèi)部工程師共同打造該項(xiàng)技術(shù)。
“神經(jīng)風(fēng)格轉(zhuǎn)變”
我的到訪發(fā)生于美國總統(tǒng)選舉兩天后,F(xiàn)acebook CEO馬克·扎克伯格(Mark Zuckerberg)稱Facebook對假消息的傳播幫助唐納德·特朗普(Donald Trump)勝選的說法“很瘋狂”.這番言論加劇了人們對于Facebook的不滿情緒,因?yàn)樵撋缃痪W(wǎng)絡(luò)去年就曾因?yàn)閯討B(tài)消息中的假消息惹起爭議。盡管這些爭議性問題很大程度上不在坎德拉的職責(zé)范圍之內(nèi),但他知道,最終Facebook對假消息危機(jī)的應(yīng)對機(jī)制將依賴于他的團(tuán)隊(duì)將有份參與的機(jī)器學(xué)習(xí)工作。
接著,坎德拉想要給我展示某樣別的東西--演示其團(tuán)隊(duì)的一個(gè)作品。讓我意外的是,它是一個(gè)相對無聊的伎倆:以知名畫家藝術(shù)作品的風(fēng)格來重新繪制照片或者串流視頻。事實(shí)上,它讓人想起了Snapchat上可以看到的那種數(shù)字玩意,用畢加索的立體主義風(fēng)格來重繪照片的想法也已經(jīng)被完成過。
“這背后的技術(shù)名為神經(jīng)風(fēng)格轉(zhuǎn)變?!彼忉尩?,“經(jīng)過訓(xùn)練,這種大型神經(jīng)網(wǎng)絡(luò)能夠用特定的風(fēng)格重新繪制照片?!彼统鍪謾C(jī),打開了一張照片。僅僅點(diǎn)擊一下滑動一下,它就變成梵高《星夜》的衍生品一樣。更令人印象深刻的是,它能夠生成特定風(fēng)格的串流視頻。他還說,真正特別的是某樣我看不到的東西:Facebook打造了神經(jīng)網(wǎng)絡(luò),讓它能夠在手機(jī)上運(yùn)行。
這也不是什么新鮮技術(shù)--蘋果此前曾吹噓有在iPhone上進(jìn)行某種神經(jīng)計(jì)算。但這對于Facebook來說難度要大得多,因?yàn)樗鼰o法掌控硬件本身。坎德拉說,他的團(tuán)隊(duì)能夠執(zhí)行這種任務(wù),是因?yàn)椴块T工作的不斷累積--每個(gè)項(xiàng)目的完成都讓另一個(gè)項(xiàng)目變得更加簡單,每個(gè)項(xiàng)目的建造,都讓未來的工程師能夠打造出需要更少訓(xùn)練的同類產(chǎn)品--因此像這樣的項(xiàng)目能夠快速打造出來?!皬拈_始著手做這個(gè)到拿來出進(jìn)行公開測試,我們只花了8個(gè)星期,很很瘋狂?!彼f。
坎德拉稱,做像這樣的任務(wù)的另一個(gè)秘訣是協(xié)作--Facebook文化的中流砥柱。在做該任務(wù)時(shí),容易接洽Facebook其它的部門,尤其是非常熟悉iPhone硬件的移動團(tuán)隊(duì),讓他們能夠跳過在Facebook的數(shù)據(jù)中心渲染圖像的過程,從而直接在手機(jī)上執(zhí)行該項(xiàng)工作。這帶來的好處遠(yuǎn)不止是能夠使得你的親朋好友的影像變成《吶喊》(The Scream)風(fēng)格。這是讓整個(gè)Facebook變得更加強(qiáng)大的一步。短期來說,這可以加快在語言解讀和文本理解上的響應(yīng)。長期來說,它有助于實(shí)時(shí)分析你的所見所講?!拔覀兪窃谡f轉(zhuǎn)瞬之間的事情--這必須要做到實(shí)時(shí)?!彼f,“我們是社交網(wǎng)絡(luò),如果我要預(yù)測人們對于某個(gè)內(nèi)容的反饋,那我的系統(tǒng)就需要即時(shí)作出響應(yīng),對吧?”
“在手機(jī)上運(yùn)行復(fù)雜的神經(jīng)網(wǎng)絡(luò),意味著你將AI帶到每個(gè)人的手中?!彼f,“這不是偶然發(fā)生的事情。它是我們在公司內(nèi)部廣泛推廣AI的一部分?!?/p>
“這是一個(gè)漫長的征程?!彼a(bǔ)充道。
坎德拉的出身
坎德拉出生于西班牙。他在3歲時(shí)隨家人移居摩洛哥,并在那里上法語學(xué)校。雖然他的科學(xué)和人文學(xué)科成績非常優(yōu)異,但在決定到馬德里上大學(xué)時(shí),他選擇了他認(rèn)為最難的學(xué)科:電信工程。電信工程不僅僅需要掌握像天線和放大器這樣的物理知識,還需要懂得數(shù)據(jù)分析,這在他看來“很酷”.他非常仰慕一位改造自適應(yīng)系統(tǒng)的教授??驳吕隽藗€(gè)系統(tǒng),利用智能過濾器來改進(jìn)漫游手機(jī)的信號;如今他稱這是“幼小版神經(jīng)網(wǎng)絡(luò)”.他癡迷于訓(xùn)練算法,不滿足于只是編寫代碼。在2000年在丹麥度過的一個(gè)學(xué)期,他遇見曾在多倫多與機(jī)器學(xué)習(xí)領(lǐng)域的傳奇杰夫·辛頓(Geoff Hinton)一道學(xué)習(xí)的機(jī)器學(xué)習(xí)教授卡爾·拉斯馬森(Carl Rasmussen),這進(jìn)一步激發(fā)了他對訓(xùn)練算法的熱情。在畢業(yè)之際,他準(zhǔn)備進(jìn)入寶潔公司的一個(gè)領(lǐng)導(dǎo)力項(xiàng)目。此時(shí)拉斯馬森則邀請他去讀博士,最終他選擇了機(jī)器學(xué)習(xí)專業(yè)。
2007年,他加入微軟研究院位于英格蘭劍橋的實(shí)驗(yàn)室。他在加盟不久后獲知公司要舉行比賽:微軟準(zhǔn)備推出必應(yīng),但需要在搜索廣告這一重要組成部分上進(jìn)行改進(jìn)--準(zhǔn)確預(yù)測用戶會在什么時(shí)候點(diǎn)擊廣告。該公司決定就此舉行內(nèi)部比賽。勝出團(tuán)隊(duì)的解決方案將接受測試看看是否值得推出,團(tuán)隊(duì)成員也將獲得免費(fèi)到夏威夷旅游的獎(jiǎng)勵(lì)。19個(gè)團(tuán)隊(duì)參與競爭,最后坎德拉的團(tuán)隊(duì)并列獲得冠軍。他獲得了免費(fèi)出游的獎(jiǎng)勵(lì),但微軟卻遲遲沒有兌現(xiàn)更大的獎(jiǎng)品(展開測試來決定他的作品是否可以推出),這讓他感到受騙。
后來發(fā)生的事情充分顯示了坎德拉的決心。他開啟瘋狂的窮追不舍模式,以讓公司給他一次機(jī)會。他進(jìn)行了超過50次的內(nèi)部講話,他打造了模擬器來證明其算法的優(yōu)越性。他也不斷游說那位握有決策權(quán)的副總裁,不管后者去到哪,包括洗手間,他都伺機(jī)接近,不停宣講自己的系統(tǒng)。
2009年,坎德拉的算法隨必應(yīng)推出。
2012年初,坎德拉探訪在Facebook供職的一位朋友,在它的門洛帕克園區(qū)呆了一個(gè)周五。他驚訝地發(fā)現(xiàn),在這家公司,人們并不需要乞求上級批準(zhǔn)測試他們的作品。他們直接那么做就行了。在接下來的周一,他去Facebook面試,周末便拿到了要約。
當(dāng)初的模型并不先進(jìn)
加入Facebook的廣告團(tuán)隊(duì)后,坎德拉的任務(wù)是領(lǐng)導(dǎo)一個(gè)小組展示相關(guān)度更高的廣告??驳吕f,雖然當(dāng)時(shí)的系統(tǒng)有使用機(jī)器學(xué)習(xí)技術(shù),“但我們所使用的模型并不是很先進(jìn),它們很簡單。”
侯賽因·梅漢納(Hussein Mehanna)是另一位跟坎德拉同時(shí)間加盟Facebook的工程師,他同樣對該公司的系統(tǒng)在整合AI上缺乏進(jìn)展感到驚訝?!霸谖疫€沒有加入Facebook之前,看到該產(chǎn)品的質(zhì)量,我以為一切都已經(jīng)成型,但很顯然還沒有?!泵窛h納說,“在入職幾個(gè)星期后,我就跟坎德拉說,F(xiàn)acebook真正缺少的是一個(gè)合適的世界級機(jī)器學(xué)習(xí)平臺。我們有機(jī)器,但沒有合適的軟件來幫助機(jī)器盡可能多地從數(shù)據(jù)學(xué)習(xí)?!保窛h納如今是Facebook核心機(jī)器學(xué)習(xí)主管,也曾在微軟供職多年--本文另外幾位受訪的工程師也是微軟出身。巧合?)
對于“機(jī)器學(xué)習(xí)平臺”,梅漢納是說在基于大腦運(yùn)作方式的模型普及后,那個(gè)將AI帶出上世紀(jì)的寒冬期進(jìn)入近年的綻放時(shí)期的范例的普及。以廣告為例,F(xiàn)acebook需要它的系統(tǒng)做某種沒有人能夠做的事情:即時(shí)且準(zhǔn)確地預(yù)測有多少人會點(diǎn)擊給定的廣告。于是坎德拉和他的團(tuán)隊(duì)著手打造一個(gè)基于機(jī)器學(xué)習(xí)程序的新系統(tǒng)。由于該團(tuán)隊(duì)想要將該系統(tǒng)打造成平臺,讓該部門所有的工程師都可以訪問,他們采取了一種讓建模和訓(xùn)練能夠推廣和復(fù)制的建造方式。
打造機(jī)器學(xué)習(xí)系統(tǒng)的一大重要因素是獲得優(yōu)質(zhì)數(shù)據(jù)--越多越好。幸運(yùn)的是,這是Facebook最大的資產(chǎn)之一:當(dāng)你有超過10億人每天使用你的產(chǎn)品,你就可以給你的訓(xùn)練集收集大量的數(shù)據(jù),一旦開始測試你也可以獲得無數(shù)用戶行為方面的例子。正因?yàn)榇?,廣告團(tuán)隊(duì)能夠加快到每周推出幾個(gè)模型,而不再是每幾周推出一個(gè)新模型。由于要將系統(tǒng)做成平臺--讓公司內(nèi)部其他的人員也能夠用來開發(fā)他們自己的產(chǎn)品--坎德拉得聯(lián)手?jǐn)?shù)個(gè)團(tuán)隊(duì)來展開工作。這是一個(gè)精細(xì)的分三步走的過程?!澳阋葘W⒂谛阅?,再專注于效用,然后專注于打造社區(qū)?!彼f道。
坎德拉的廣告團(tuán)隊(duì)證明了機(jī)器學(xué)習(xí)技術(shù)在Facebook的變革性?!拔覀冊陬A(yù)測點(diǎn)擊、點(diǎn)贊、轉(zhuǎn)換等方面變得極為成功?!彼f。將那種模式擴(kuò)展到Facebook平臺的其它服務(wù)也就成了順理成章的事情。事實(shí)上,F(xiàn)AIR領(lǐng)導(dǎo)者樂昆之前就在呼吁設(shè)立部門來負(fù)責(zé)將AI應(yīng)用到產(chǎn)品當(dāng)中--準(zhǔn)確來說,是在公司內(nèi)部更大范圍地推廣機(jī)器學(xué)習(xí)技術(shù)?!拔业拇_曾呼吁設(shè)立這樣的部門,因?yàn)槟阈枰@樣由優(yōu)秀工程師人才組成的組織專注于可為很多產(chǎn)品部門使用的基礎(chǔ)技術(shù),而不是直接負(fù)責(zé)產(chǎn)品。”樂昆表示。
2015年10月,坎德拉成為新AML團(tuán)隊(duì)的主管(有一段時(shí)間,出于謹(jǐn)慎起見,他保留他在廣告部門的職位,在兩個(gè)職位之間穿梭)。他與FAIR保持緊密的聯(lián)系。FAIR在紐約市、巴黎和門洛帕克均設(shè)有辦事處,在門洛帕克它的研究人員實(shí)際上就在AML工程師的旁邊工作。
AML和FAIR之間的協(xié)作,從一個(gè)給用戶分享的照片提供語音描述的研發(fā)中的產(chǎn)品可見一斑。在過去的幾年里,訓(xùn)練系統(tǒng)識別場景中的物品或者做出一般性的結(jié)論,如照片是在室內(nèi)還是室外拍的,已經(jīng)成為了標(biāo)準(zhǔn)的AI慣例。但最近,F(xiàn)AIR的科學(xué)家找到方法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)描述圖像中幾乎所有的有趣物體,然后根據(jù)物體的位置和相對其它物體的位置來判斷照片是關(guān)于什么的--實(shí)際上是通過分析姿勢來判斷特定照片里人們是在擁抱,還是在騎馬?!拔覀兘oAML部門展示了這項(xiàng)技術(shù),”樂昆說,“他們想了想,說,‘在這種情境中,那個(gè)技術(shù)會很有用。’”最終他們做出了一項(xiàng)可造福盲人或者視覺障礙著的功能原型,用戶指向圖像,就能讓他們的手機(jī)通過語音給他們描述圖像的內(nèi)容。
“我們一直都在溝通,”坎德拉如是說到他的兄弟團(tuán)隊(duì),“總的來說,要從科學(xué)技術(shù)發(fā)展到實(shí)際的項(xiàng)目,你需要粘合劑對吧?我們就是粘合劑?!?/p>
AI的四個(gè)應(yīng)用領(lǐng)域
坎德拉將AI的應(yīng)用分成四個(gè)領(lǐng)域:視覺、語言、語音和攝像效果。他表示,所有的這些東西將會帶來“內(nèi)容理解引擎。”通過研究如何理解平臺內(nèi)容的意思,F(xiàn)acebook想要從評論中檢測出微妙的意圖,從口語中提取出細(xì)微的東西,鑒別你在視頻中快速出現(xiàn)的朋友的面孔,解讀你的表情,然后將它們反映在你在虛擬現(xiàn)實(shí)場景中的化身。
“我們在研究AI的普遍化?!笨驳吕f,“隨著內(nèi)容的爆炸性增長,我們需要提升理解和分析能力?!苯鉀Q方案就在于打造普遍化的系統(tǒng),使得一個(gè)項(xiàng)目的成功能夠積累起來,讓其它研究相關(guān)項(xiàng)目的團(tuán)隊(duì)能夠受益??驳吕Q,“如果我能夠打造出可將知識從一項(xiàng)任務(wù)轉(zhuǎn)移到另一項(xiàng)的算法,那會很美妙,是吧?”
那種知識轉(zhuǎn)移能夠大大加快Facebook推出產(chǎn)品的速度。以Instagram為例。自上線以來,該照片分享服務(wù)就以時(shí)間倒序的形式來顯示用戶的照片。但2016年年初,它決定使用算法來按照相關(guān)性將照片排序??驳吕赋?,好消息是,由于AML已經(jīng)在像動態(tài)消息(News Feed)這樣的產(chǎn)品中實(shí)施過機(jī)器學(xué)習(xí)技術(shù),“Instagram不必從頭開始做?!彼€說,“他們讓一兩個(gè)精通機(jī)器學(xué)習(xí)的工程師聯(lián)系部分其它在運(yùn)行某種內(nèi)容排序應(yīng)用的團(tuán)隊(duì)。然后,你可以直接將工作流程復(fù)制過來,有什么問題就問對方?!闭?yàn)榇?,Instagram短短幾個(gè)月就能夠?qū)嵤┻@一重大變動。
AML團(tuán)隊(duì)一直都在尋找它的神經(jīng)網(wǎng)絡(luò)技術(shù)能夠跟多個(gè)其它團(tuán)隊(duì)的技術(shù)相結(jié)合的使用案例,以打造適用于整個(gè)Facebook平臺的獨(dú)特功能?!拔覀兝脵C(jī)器學(xué)習(xí)技術(shù)來打造我們的核心功能和取悅我們的用戶?!盇ML感知團(tuán)隊(duì)首席工程師湯墨·雷范德(Tommer Leyvand)說。(他也曾供職于微軟。)
其中一個(gè)案例是最近的一項(xiàng)名為社交推薦的功能。大約一年前,AML的一位工程師和Facebook分享團(tuán)隊(duì)的一位產(chǎn)品經(jīng)理在討論人們叫朋友推薦本地的美食或者服務(wù)時(shí)活躍度很高?!皢栴}在于,你要如何將相關(guān)內(nèi)容呈現(xiàn)給用戶呢?”AML自然語言團(tuán)隊(duì)產(chǎn)品經(jīng)理麗塔·阿基諾(Rita Aquino)說道。為此,該共享團(tuán)隊(duì)一直在嘗試匹配推薦請求相關(guān)的特定用語?!拌b于你一天有10億條帖子,那不一定很準(zhǔn)確,不一定可擴(kuò)展?!卑⒒Z指出。通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)和用用戶的實(shí)時(shí)行為測試模型,該團(tuán)隊(duì)能夠檢測出非常細(xì)微的語言差別,因而能夠準(zhǔn)確檢測用戶是在問特定區(qū)域哪里有美食,還是問該在哪里買鞋子。那會觸發(fā)請求出現(xiàn)在動態(tài)消息的合適聯(lián)系人上。接下來的一步同樣由機(jī)器學(xué)習(xí)驅(qū)動,是判斷出用戶在提供似乎合理的推薦,在用戶的動態(tài)消息中顯示商家的位置或者餐館在地圖上的位置。
阿基諾稱,在她進(jìn)入Facebook后的一年半里,AI已經(jīng)從鮮少出現(xiàn)在公司的產(chǎn)品當(dāng)中,變成產(chǎn)品從開發(fā)之初就要引入。“人們希望他們所使用的產(chǎn)品變得更加智能?!彼f,“團(tuán)隊(duì)們看到像社交推薦這樣的產(chǎn)品,看到我們的代碼,就會說‘我們要如何做這個(gè)?’你不必成為機(jī)器學(xué)習(xí)專家就能夠?yàn)槟愕膱F(tuán)隊(duì)帶來這樣的技術(shù)?!币宰匀徽Z言處理為例,該團(tuán)隊(duì)打造了一個(gè)其它團(tuán)隊(duì)也能夠輕松接入的系統(tǒng),該系統(tǒng)名為Deep Text.它有助于驅(qū)動Facebook每天為逾40億帖子使用的翻譯功能背后的機(jī)器學(xué)習(xí)技術(shù)。
對于圖像和視頻,AML團(tuán)隊(duì)打造了名為Lumos的機(jī)器學(xué)習(xí)視覺平臺。Lumos在馬諾哈爾·帕魯里(Manohar Paluri)當(dāng)初在FAIR做實(shí)習(xí)生時(shí)打造的,他將該大型機(jī)器學(xué)習(xí)視覺平臺稱之為Facebook的視覺皮層--處理和理解Facebook上發(fā)布的所有圖像和視頻的方式。在2014年的一次黑客松中,帕魯里和同事尼基爾·約里(Nikhil Johri)一同在一天半內(nèi)打造出了原型,并給非常興奮的扎克伯格和Facebook首席運(yùn)營官謝麗爾·桑德伯格(Sheryl Sandberg)展示了他們的成果??驳吕_始在AML工作時(shí),帕魯里便加盟,領(lǐng)導(dǎo)計(jì)算機(jī)視覺團(tuán)隊(duì),打造Lumos來幫助Facebook所有的工程師(包括Instagram、Messenger、WhatsApp、Oculus等產(chǎn)品的工程師)利用該視覺皮層。
“有了Lumos,公司任何人都能夠使用來自這些不同的神經(jīng)網(wǎng)絡(luò)的功能,針對他們特定的場景打造模型,看看模型是否奏效?!蓖瑫r(shí)在AML和FAIR任職的帕魯里指出,“然后,他們可以派一個(gè)人修正系統(tǒng),對它進(jìn)行重新訓(xùn)練和推送,完全不需要AML團(tuán)隊(duì)的人參與進(jìn)來?!?/p>
帕魯里快速地給我演示了一下。他打開他筆記本上的Lumos,然后我們開始做一項(xiàng)樣本任務(wù):改進(jìn)神經(jīng)網(wǎng)絡(luò)識別直升飛機(jī)的能力。一個(gè)布滿圖片的頁面(不斷滾動下去,共有5000張圖片)出現(xiàn)在屏幕上,滿是直升飛機(jī)和直升飛機(jī)以外物品的圖片。對于這些數(shù)據(jù)集,F(xiàn)acebook采用的是來自旗下資產(chǎn)公開發(fā)布的圖片。雖然我不是工程師,更不是AI專家,但點(diǎn)擊那些錯(cuò)誤例子來“訓(xùn)練直升飛機(jī)圖像分類器”對我來說也并不困難。
“智能應(yīng)用開發(fā)將快上百倍”
最終,這個(gè)“分類”步驟(被稱為監(jiān)督式學(xué)習(xí))可能會被自動化,因?yàn)樵摴驹谧非髾C(jī)器學(xué)習(xí)的圣杯:“非監(jiān)督式學(xué)習(xí)”,神經(jīng)網(wǎng)絡(luò)能夠自行判斷那些圖像里面有什么東西。帕魯里說,公司正在取得進(jìn)展?!拔覀兊哪繕?biāo)是,未來一年將人工標(biāo)注的數(shù)量減少100倍?!?/p>
長期而言,F(xiàn)acebook將會為將視覺皮層和自然語言平臺融合起來,以實(shí)現(xiàn)坎德拉所說的普遍性內(nèi)容理解引擎?!昂翢o疑問,我們將會把它們結(jié)合起來?!迸留斃镎f。
最終,F(xiàn)acebook希望,它用于其進(jìn)展的核心原則將會通過期刊論文等形式在公司以外流傳開來,使得它的普遍化做法能夠更大范圍地推廣機(jī)器學(xué)習(xí)技術(shù)。“你能夠大大加快智能應(yīng)用開發(fā)速度,而不再需要花費(fèi)好些年的時(shí)間。”梅漢納指出,“想象這對于醫(yī)療、安全、交通等行業(yè)的影響吧。我想,在那些領(lǐng)域打造應(yīng)用未來將要快上百倍以上?!?/p>
AML在深度參與這個(gè)給Facebook的產(chǎn)品帶來視覺、解讀能力甚至說話能力的史詩般進(jìn)程,扎克伯格認(rèn)為這對于實(shí)現(xiàn)其對Facebook造福社會的愿景也至關(guān)重要。在扎克伯格有關(guān)建設(shè)社區(qū)的長篇人道主義宣言中,該CEO多達(dá)七次說到“人工智能”或者“AI”,全都是在說機(jī)器學(xué)習(xí)和其它的技術(shù)將如何保障社區(qū)的安全和消息靈通的語境中提及的。
實(shí)現(xiàn)那些目標(biāo)不會是易事,這也是坎德拉當(dāng)初在猶豫是否出任AML的職位時(shí)擔(dān)心的事情。單個(gè)的機(jī)器學(xué)習(xí)無法解決所有人的問題,而你是要嘗試成為上十億用戶發(fā)現(xiàn)信息和建立個(gè)人連接的主要來源。正因?yàn)榇?,F(xiàn)acebook在不斷搗鼓決定用戶在動態(tài)消息中看到的內(nèi)容的算法--當(dāng)你不確定什么才是最優(yōu)的內(nèi)容組合時(shí),你要如何訓(xùn)練系統(tǒng)來提供最優(yōu)的內(nèi)容組合呢?“我想這是一個(gè)近乎無解的問題?!笨驳吕f,“我們隨機(jī)展示消息內(nèi)容的話,意味著要浪費(fèi)你的時(shí)間,是吧?而我們只顯示來自一個(gè)朋友的消息內(nèi)容的話,又等于是贏家通吃。你可能會一直陷入這種討論當(dāng)中,走兩個(gè)極端顯然都不是最優(yōu)解決方案。我們嘗試進(jìn)行一些探索?!盕acebook將會利用AI繼續(xù)嘗試解決這個(gè)問題。“目前機(jī)器學(xué)習(xí)和AI領(lǐng)域有許多優(yōu)化那種探索方面的研究?!笨驳吕f,聽起來很有希望。
假消息問題
當(dāng)Facebook發(fā)現(xiàn)自己被指是假消息傳播的罪魁禍?zhǔn)讜r(shí),它理所當(dāng)然地號召它的AI團(tuán)隊(duì)來快速清理其服務(wù)上的假消息。樂昆指出,這是一項(xiàng)非比尋常的全員行動,當(dāng)中甚至包括幾乎是擔(dān)當(dāng)“顧問”角色的FAIR團(tuán)隊(duì)。FAIR已經(jīng)打造了一項(xiàng)工具來幫助解決該問題:一個(gè)名為World2Vec的模型。World2Vec給神經(jīng)網(wǎng)絡(luò)增加了某種記憶功能,可幫助Facebook給所有的內(nèi)容標(biāo)上一些信息,如內(nèi)容的來源和分享者。有了那些信息,F(xiàn)acebook就能夠理解假消息的的分享模式,進(jìn)而利用機(jī)器學(xué)習(xí)技術(shù)清除那些內(nèi)容?!笆聦?shí)證明,識別假消息跟識別人們最想要看的頁面并沒有什么不同?!睒防ブ赋?。
出自坎德拉團(tuán)隊(duì)的原有平臺讓Facebook能夠更加快速地推出那些內(nèi)容審查產(chǎn)品。它們實(shí)際上作用有多大還有待觀察;坎德拉說,現(xiàn)在分享數(shù)據(jù)來說明公司在借助算法裁判減少假消息上做得有多好,還為時(shí)過早。但不管那些新措施是否奏效,該困境本身也提出了一個(gè)問題:用算法來解決問題--即便算法借助機(jī)器學(xué)習(xí)技術(shù)得到了改進(jìn)--是否不可避免地會產(chǎn)生意想不到甚至有害的結(jié)果。肯定有人會說這種情況2016年就發(fā)生過。
坎德拉對此提出異議。“我想我們讓世界變得更好了?!彼f,還講了一個(gè)故事。就在接受采訪前一天,坎德拉給一個(gè)他僅見過一次的Facebook聯(lián)系人打電話,那是他朋友的父親。他看到那個(gè)人發(fā)布支持特朗普的內(nèi)容,對此他覺得有些困惑。之后,坎德拉意識到自己的職責(zé)是根據(jù)數(shù)據(jù)做出決策,他缺少重要的信息。于是他發(fā)信息給那個(gè)人,請求進(jìn)行通話。后者同意后,他們進(jìn)行了電話通話。“這沒有幫我改變現(xiàn)實(shí),但卻讓我能夠從很不一樣的角度來看問題?!笨驳吕f道,“要是在沒有Facebook的世界,我永遠(yuǎn)都不會和他有交集?!?/p>
換句話來說,雖然AI之于Facebook非常重要,甚至關(guān)乎存亡,但它并不是唯一的答案?!拔覀兊奶魬?zhàn)在于,AI實(shí)際上還處于初生階段,”坎德拉說,“我們才剛上路。”
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )