高層速讀
關(guān)鍵信息:通過將兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行相互對(duì)立,Ian Goodfellow(伊恩·古德費(fèi)羅)創(chuàng)造了一個(gè)強(qiáng)大的人工智能工具——生成式對(duì)抗網(wǎng)絡(luò)(GAN)。GAN在生成模型和判別模型的互相博弈學(xué)習(xí)產(chǎn)生好的輸出,能夠給予機(jī)器想象、創(chuàng)造的東西,具有一定的自主意識(shí)。
關(guān)鍵意義:GAN是人工智能中所謂“無監(jiān)督學(xué)習(xí)”的一大步,更能夠使機(jī)器更少地依賴人類來幫助它們了解這個(gè)世界。
| 關(guān)于生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Net)
近年來,深度學(xué)習(xí)技術(shù)被廣泛應(yīng)用于各類數(shù)據(jù)處理任務(wù)中,比如圖像、語音和文本。而生成式對(duì)抗網(wǎng)絡(luò)(GAN)是一種深度學(xué)習(xí)模型,也是無監(jiān)督學(xué)習(xí)最具前景的方法之一。GAN通過框架中(至少)兩個(gè)模塊:生成模型(Generative Model)和判別模型(Discriminative Model)的互相博弈學(xué)習(xí)產(chǎn)生好的輸出。
GAN深度學(xué)習(xí)模型:讓機(jī)器學(xué)會(huì)創(chuàng)造
2014的一天晚上, Goodfellow和他剛畢業(yè)的博士同學(xué)們一起喝酒慶祝,在蒙特利爾最受歡迎的酒吧Les 3 Brasseur,當(dāng)時(shí)一些朋友想讓他幫忙做一個(gè)非常棘手的項(xiàng)目:一個(gè)可以自己制作照片的電腦程序。
當(dāng)時(shí)研究人員已經(jīng)在使用神經(jīng)網(wǎng)絡(luò)作為對(duì)策,這種算法以人腦中的神經(jīng)元網(wǎng)絡(luò)作為生成模型,用以創(chuàng)造合理的新數(shù)據(jù)。但結(jié)果往往不是很好:計(jì)算機(jī)生成的臉往往很模糊,或者有錯(cuò)誤,如缺少耳朵等。 Goodfellow的朋友們提出的改進(jìn)是對(duì)構(gòu)成照片的元素進(jìn)行復(fù)雜的統(tǒng)計(jì)分析,以幫助機(jī)器自行生成圖像。然而這將需要大量的數(shù)據(jù)和運(yùn)算, Goodfellow告訴他們這根本行不通。
但是,當(dāng)他在喝著啤酒思考這個(gè)問題時(shí),他想到了一個(gè)主意:如果讓兩個(gè)神經(jīng)網(wǎng)絡(luò)互相對(duì)抗呢?他的朋友們對(duì)此持懷疑態(tài)度,但他決定試一試。Goodfellow在家中寫代碼一直到凌晨,然后測(cè)試了他做寫的軟件,第一次成功了。
▲Goodfellow
Goodfellow那晚發(fā)明的東西現(xiàn)在被稱為“GAN”,也叫“生成式對(duì)抗網(wǎng)絡(luò)”,可應(yīng)用在NPL(自然語言處理)等技術(shù)領(lǐng)域。這項(xiàng)技術(shù)在機(jī)器學(xué)習(xí)領(lǐng)域引發(fā)了巨大影響,其創(chuàng)作者也變成了人工智能領(lǐng)域的重要人物。
在過去的幾年里,人工智能研究人員利用一種叫做深度學(xué)習(xí)的技術(shù)取得了令人興奮的進(jìn)展。例如提供一個(gè)有足夠圖像數(shù)據(jù)的深度學(xué)習(xí)系統(tǒng),它可以識(shí)別出即將過馬路的行人。深度學(xué)習(xí)技術(shù)使得自動(dòng)駕駛汽車和為Alexa、Siri等虛擬助手提供動(dòng)力的人機(jī)對(duì)話成為可能。
但是,盡管深度學(xué)習(xí)的人工智能可以學(xué)會(huì)識(shí)別事物,但他們并不擅長(zhǎng)創(chuàng)造事物。而GAN的目標(biāo)是給機(jī)器一些類似于想象、創(chuàng)造的東西。
讓機(jī)器進(jìn)行創(chuàng)造不僅能使他們進(jìn)行繪畫或作曲,更重要的是,這能使它們更少地依賴人類來幫助它們了解這個(gè)世界和其運(yùn)作方式。今天,人工智能程序員經(jīng)常需要告訴機(jī)器所提供的訓(xùn)練數(shù)據(jù)是什么,比如在一百萬張圖片中,哪一張包含行人橫過馬路,哪些沒有。這不僅數(shù)據(jù)和人力成本高,而且限制了機(jī)器系統(tǒng)處理的能力,即使是輕微的偏離數(shù)據(jù)的訓(xùn)練。在未來,計(jì)算機(jī)將在不被告知的情況下更好地利用原始數(shù)據(jù)并計(jì)算出他們需要從中學(xué)習(xí)的東西。
▲微軟推出的“看圖作畫”機(jī)器人
這是人工智能中所謂“無監(jiān)督學(xué)習(xí)”的一大步。譬如,一輛自動(dòng)駕駛汽車可以在不離開車庫的情況下自學(xué)到許多不同的道路條件;機(jī)器人可以預(yù)見它在繁忙的倉庫中可能遇到的障礙,而不需要帶著它去倉庫中體驗(yàn)。
我們擁有想象和思考許多不同情景的能力是我們成為人類的原因之一。當(dāng)未來的技術(shù)歷史學(xué)家回顧過去時(shí),他們可能會(huì)認(rèn)為GAN是朝著創(chuàng)造具有人類意識(shí)的機(jī)器邁出的一大步。Facebook首席人工智能科學(xué)家Yann LeCun稱GANs是“過去20年來深度學(xué)習(xí)中最酷的想法”。另一位人工智能名人、中國百度前首席科學(xué)家吳恩達(dá)(AndrewNg)也表示,GAN代表著“一項(xiàng)重大而根本性的進(jìn)步”,這激發(fā)了越來越多的全球研究人員投入到深度學(xué)習(xí)研發(fā)之中。
生成式對(duì)抗網(wǎng)絡(luò)要“對(duì)抗”多種因素
Goodfellow現(xiàn)在是谷歌大腦團(tuán)隊(duì)的一名科學(xué)家,該公司位于加州山景城的總部。當(dāng)記者在那里遇見他時(shí),他仍然對(duì)人工智能名人身份感到驚訝,稱這是“有點(diǎn)超現(xiàn)實(shí)”。同樣令人驚訝的是,他已經(jīng)發(fā)現(xiàn)了有人正在利用GAN達(dá)到不法目的,現(xiàn)在他的大部分時(shí)間都花在這方面。
GAN的特點(diǎn)在于兩個(gè)神經(jīng)網(wǎng)絡(luò)之間的對(duì)抗。第一個(gè)被稱為生成器,負(fù)責(zé)輸出盡可能逼真的素材,如照片或手寫稿。第二個(gè)被稱為鑒別器,它將這些圖像與原始數(shù)據(jù)集中的真實(shí)圖像進(jìn)行比較,并試圖確定哪些是真實(shí)的,哪些是假的。在這些結(jié)果的基礎(chǔ)上,生成器再調(diào)整其參數(shù)以創(chuàng)建新的圖像。如此循環(huán),直到鑒別器不能再分辨出真假。
在去年一個(gè)公開的例子中,芯片公司英偉達(dá)的研究人員對(duì)GAN進(jìn)行了培訓(xùn),通過研究真實(shí)的照片來生成虛擬名人的照片。雖然并不是所有的「假明星」都是完美的,但與其他需要數(shù)萬張訓(xùn)練圖像的機(jī)器學(xué)習(xí)方法相比,GAN可以精通幾百張圖像。
原始訓(xùn)練數(shù)據(jù)的質(zhì)量對(duì)訓(xùn)練效果也有很大的影響。在一個(gè)例子中,GAN開始制作帶有隨機(jī)字母的貓圖片。因?yàn)橛?xùn)練數(shù)據(jù)中包含了來自互聯(lián)網(wǎng)的貓模因(模因即在生物進(jìn)化中與基因作用類似的事物),所以機(jī)器已經(jīng)告訴自己,字母是它作為一只貓的含義的一部分。
華盛頓大學(xué)的機(jī)器學(xué)習(xí)研究人員Pedro Domingos說道,GAN是個(gè)性情暴躁的AI。如果鑒別器太容易欺騙,生成器輸出將看上去不真實(shí)。而校準(zhǔn)兩個(gè)對(duì)抗的神經(jīng)網(wǎng)絡(luò)可能很困難,這就解釋了為什么GAN有時(shí)會(huì)輸出奇怪的東西,比如有兩個(gè)頭的動(dòng)物。
▲GAN輸出的假照片
然而,這些挑戰(zhàn)并沒有阻止研究人員。自從 Goodfellow和其他幾個(gè)人在2014發(fā)表了關(guān)于他發(fā)現(xiàn)的第一份研究報(bào)告以來,已經(jīng)有了數(shù)百篇與GAN有關(guān)的論文。這項(xiàng)技術(shù)的一位粉絲甚至創(chuàng)建了一個(gè)名為“GAN Zoo”的網(wǎng)頁,致力于跟蹤已經(jīng)開發(fā)出來的各種技術(shù)版本。
GAN深度學(xué)習(xí)模型最明顯的即時(shí)應(yīng)用是在涉及大量圖像的領(lǐng)域,如電子游戲和時(shí)尚領(lǐng)域。但展望未來, Goodfellow認(rèn)為GAN將推動(dòng)更大的進(jìn)步。他說:“科學(xué)和工程領(lǐng)域有很多方面需要優(yōu)化,”他舉例說,比如需要更有效的藥物或必須提高電池的效率?!斑@將是下一波巨浪?!?/p>
在高能物理中,科學(xué)家們使用強(qiáng)大的計(jì)算機(jī)來模擬數(shù)百個(gè)微粒像瑞士核研究中心大型粒子對(duì)撞機(jī)這樣的機(jī)器中可能發(fā)生的相互作用。這些模擬速度慢,需要大量的計(jì)算力。耶魯大學(xué)和勞倫斯伯克利國家實(shí)驗(yàn)室的研究人員開發(fā)了一種GAN,在對(duì)現(xiàn)有的模擬數(shù)據(jù)進(jìn)行訓(xùn)練之后,GAN學(xué)會(huì)了準(zhǔn)確地預(yù)測(cè)某一粒子的行為,并使其運(yùn)行得更快。
醫(yī)學(xué)研究是深度學(xué)習(xí)另一個(gè)有前途的領(lǐng)域,隱私問題的存在意味著研究人員有時(shí)無法獲得足夠的真實(shí)病人數(shù)據(jù),比如分析藥物無效的數(shù)據(jù)。賓夕法尼亞大學(xué)的CaseyGreene說,GAN可以通過生成幾乎和真實(shí)記錄一樣好的假記錄來幫助解決這個(gè)問題。這些數(shù)據(jù)可以更廣泛地共享和研究,而真正的記錄則受到嚴(yán)格保護(hù)。
GAN之父:技術(shù)進(jìn)步不能缺少負(fù)面因素
然而,技術(shù)有黑暗的一面。一臺(tái)用來制造「真實(shí)假貨」的機(jī)器,對(duì)于那些想要影響股票價(jià)格、選舉等假新聞的提供者來說,是一個(gè)完美的武器。況且,人工智能已經(jīng)被用來在色情片的身體上放別人臉的照片,以及在政客的嘴上放上文字。GAN雖沒有制造這個(gè)問題,但GAN的存在確實(shí)會(huì)讓問題更糟。
哈尼·法里德(Hany Farid)是達(dá)特茅斯學(xué)院(DartmouthCollege)的數(shù)字取證專業(yè)畢業(yè)生,目前他正在研究更有效的識(shí)別假視頻的方法,比如檢測(cè)吸入和呼氣引起的面部顏色的細(xì)微變化,這種方法是有效的,因?yàn)镚AN發(fā)現(xiàn)這些變化很難精確模仿。但Hany Farid警告說,GAN會(huì)反過來適應(yīng),“我們從根本上說處于弱勢(shì)?!?/strong>
這種「貓捉老鼠」的游戲也將在網(wǎng)絡(luò)安全中發(fā)揮作用。研究人員已經(jīng)強(qiáng)調(diào)了“黑匣子”攻擊的風(fēng)險(xiǎn),在這種攻擊中,GAN被用來找出機(jī)器學(xué)習(xí)模型,因?yàn)樵S多安全程序都用這些模型來發(fā)現(xiàn)惡意軟件。但是,在預(yù)測(cè)了防御算法的工作原理之后,攻擊者可以避開它并插入流氓代碼。
現(xiàn)在, Goodfellow領(lǐng)導(dǎo)著谷歌的一個(gè)團(tuán)隊(duì),專注于讓機(jī)器學(xué)習(xí)更加安全。他警告說,人工智能社區(qū)必須吸取以往創(chuàng)新浪潮的教訓(xùn),在創(chuàng)新浪潮中,技術(shù)人員將安全和隱私視為事后考慮。當(dāng)他們意識(shí)到風(fēng)險(xiǎn)的時(shí)候,壞人已經(jīng)有了明顯的領(lǐng)先優(yōu)勢(shì)?!昂苊黠@,我們已經(jīng)開始了,”他說,“但希望我們能在安全方面取得重大進(jìn)展,否則我們就會(huì)離我們的出發(fā)點(diǎn)越走越遠(yuǎn)?!?/p>
盡管如此, Goodfellow認(rèn)為將不存在一個(gè)純粹沒有任何欺騙的技術(shù)解決方案。相反,他認(rèn)為,技術(shù)依賴于各種社會(huì)因素而進(jìn)步。比如教孩子們批判性思維,讓他們參加演講和辯論課。他說:“在演講和辯論中,你會(huì)和另一個(gè)學(xué)生競(jìng)爭(zhēng),你在考慮如何編造有利于自己甚至是誤導(dǎo)的說法,或者如何編造出非常有說服力的正確說法?!?/p>
Goodfellow很可能是對(duì)的,但他的結(jié)論是,科技不能解決假新聞問題,雖然這不是人們想聽到的。
微信搜索【AI商業(yè)報(bào)道】,獲取最新行業(yè)資訊!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。