過去幾年涌現(xiàn)出的一系列人工智能技術(shù),為內(nèi)容生產(chǎn)提供了強大的工具。
漫步于盧浮宮無數(shù)畫作中,你是否期待一位畫師為你記錄下獨一無二的瞬間,給這個世界留下一份凝視與回眸?走進國家圖書館浩瀚書海中,你是否期待有人陪你一同探索世界?意外闖進J.K羅琳創(chuàng)建的魔法學校,你是否期待有人為你遞上魔杖讓所有平面之物躍然紙上? 隨著不斷迭代的算法和不斷增強的算力,最新的人工智能技術(shù)正悄然將這一切變成現(xiàn)實,這些建立在數(shù)學基礎上的抽象能力正成為人類擁有特殊技能的朋友,與我們共同追逐著未來的無限可能。 寫實派畫家——GAN 生成對抗網(wǎng)絡(GAN/Generative Adversarial Networks)就像這個時代的寫實派畫家,這位畫家的大腦和畫筆就是Generator和Discriminator兩個網(wǎng)絡。在實際使用過程中,我們提供真實輸入后,它會在Generator中生成假圖片并在Discriminator中和真圖做對比。起初,Discriminator很容易分辨真假圖片。但隨著Generator通過Discriminator的反饋不斷優(yōu)化生成的圖片,分辨難度不斷提升。最終,當Discriminator沒辦法分辨真假時,假圖片就作為最終產(chǎn)物出現(xiàn)在了我們面前。 自誕生以來,生產(chǎn)對抗網(wǎng)絡就在鳥類、花卉等圖片的生成上不斷展現(xiàn)出驚人的能力,而其生成的足以亂真的人臉照片和根據(jù)文本描述生成的照片,已經(jīng)成為設計師必備的工具:前者可以作為素材庫讓設計師輕松積累素材,后者則能幫助設計師可以快速定向獲取設計靈感來源。 印象派畫家——VAE 除了“寫實派畫家”生成對抗網(wǎng)絡,人工智能領(lǐng)域也有“印象派畫家”——變分自編碼器(VAE,Variational Auto-encoder)。不同于生成對抗網(wǎng)絡,變分自編碼器在獲得輸入時會先用“取色器”(編碼器,encoder)提取畫面的重要信息,并以此為核心拓展范圍。例如,編碼器取“紅色”后會將該信息擴大到“紅色系所有顏色”,再將這些擴大后的信息作為生成元素,舉一反三生成更多新數(shù)據(jù)。 目前,這位AI時代的“梵高”已經(jīng)在包括圖像和音頻合成等領(lǐng)域找到了施展空間。由于舉一反三的屬性,變分自編碼器生成的新數(shù)據(jù)具有更好的擴展性和多樣性,也更方便地設計師對這些數(shù)據(jù)做定向調(diào)整,從而將更符合預期的數(shù)據(jù)存入素材庫作為靈感來源。 語言課代表——BERT 如同機器將圖片依性質(zhì)拆解為RGB等數(shù)值后才能理解圖片一樣,BERT(Bidirectional Encoder Representations from Transformer)也依據(jù)對文本的拆解在紛繁的語言世界中找到了梳理脈絡、理解奧秘的方法。 我們可以將BERT理解為做英語試卷的考生,第一道題“MLM(MASKED LANGUAGE MODEL)”類似完形填空,我們給BERT的語料庫會隨機遮擋15%的詞語,讓BERT根據(jù)上下文猜測空缺部分從而訓練其了解不同語境下的詞語運用,進而更準確的對語義做出理解。第二道題“NSP(NEST SENTENCE PREDICTION)”會給到成組的句子,讓BERT判斷兩個句子是否連續(xù)以及句子間的關(guān)系。有了這些基本能力后,我們只要增加輸出層訓練就能將BERT應用到不同場景。 目前,誕生不到五年的BERT已經(jīng)可以和閱讀理解、搜索與信息檢索結(jié)合起來,幫助設計師將多輪對話等場景變成現(xiàn)實。除此之外,BERT還能利用其理解學習能力在長文本中提取出重點內(nèi)容信息,讓人們可以更高效地理解文本。 讓二維變立體的神奇魔杖——NeRF 在更高維度上應用人工智能技術(shù)的努力從未停止,神經(jīng)輻射場(NeRF,Neural Radiance Fields)的脫穎而出因此并不意外。神經(jīng)輻射場能將圖像分為3個空間位置向量和2個相機觀測向量,在此基礎上輸出體密度(volume density,可以理解為透明度)和基于觀測角度的物體空間點色彩,完成從“空間點位置+觀測角度”到“空間點色彩+體密度”的映射。 在三維空間重建二維圖像具有廣闊應用前景。它能幫我們準確快速建立數(shù)字人體,從而成為數(shù)字人領(lǐng)域重要的建模工具;它也能運用到自動駕駛行業(yè),讓現(xiàn)實路況和虛擬情況實時融合,為自動駕駛提供天氣和雨雪等場景數(shù)據(jù),讓設計師圍繞人車交互進行更準確的設計思考。 技術(shù)從不抽象,它們總能直觀地刺激我們的感官、激發(fā)我們的想象力。伴隨著代碼的迭代,技術(shù)終將以更加具象的形式成為我們的朋友。我們也將與它一同探索未知并闡述理解、思考藝術(shù)并定格瞬間,突破邊界并一同走進那個虛實融合且醞釀著無數(shù)可能的“魔法世界”。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )