AI生明月,萬(wàn)里共文心

原標(biāo)題:AI生明月,萬(wàn)里共文心

今年元宵,伴隨著如火如荼的冬奧會(huì)。冰雪盛宴不僅展示了體育的魅力與奧林匹克精神,更向全球展現(xiàn)了無(wú)所不在的中國(guó)科技。這場(chǎng)盛會(huì)中百度的AI技術(shù)屢屢刷屏,我們以小見(jiàn)大,從中看到了中國(guó)科技力量全面提升,科技自信冉冉升起。

很多時(shí)候,技術(shù)的價(jià)值與魅力就是這樣,既在目光之中,又在生活之外。一次讓我們驚嘆的邂逅,背后往往有著有趣的技術(shù)邏輯,以及充滿想象力的未來(lái)前景。

比如說(shuō),當(dāng)你在“天下共元宵”H5中輸入“我想在…看月亮”的地點(diǎn)時(shí),可能并沒(méi)有發(fā)現(xiàn),此刻的你正在完成一次與AI的深度對(duì)話。

2月15日元宵節(jié),在共青團(tuán)中央宣傳部、國(guó)家航天局探月與航天工程中心指導(dǎo)下,中國(guó)青年報(bào)社聯(lián)合百度共同推出“天下共元宵”線上互動(dòng)活動(dòng)?;顒?dòng)以“嫦娥一號(hào)”傳回的首張全月影像圖為原型,使用AI生成個(gè)性化畫作。這可能是很多人第一次直觀體驗(yàn)AI大模型的魅力,體驗(yàn)到百度文心大模型的AIGC(AI Generated Content)價(jià)值。

“天下共元宵”不僅是一次詩(shī)意的期許與祝福,更是AI技術(shù)透過(guò)元宵佳節(jié)的窗戶,射出了姣姣月光。伴隨著明月升起,我們將看到大模型走向產(chǎn)業(yè)應(yīng)用的確定性未來(lái),看到是月下的AIGC的繁華盛景。

不僅在冬奧會(huì),也不僅在元宵節(jié),百度正在用AI之筆,寫下一句“萬(wàn)里共文心”。

明月初升:月下的你,“月中”的AI

明月是中國(guó)人不變的鄉(xiāng)愁,是人類藝術(shù)史永恒的執(zhí)念。在“天下共元宵”互動(dòng)活動(dòng)中,用戶可以輸入一個(gè)地名,既可以是自己的家鄉(xiāng),也可以是讓我們神往的異國(guó)他鄉(xiāng),甚至是雪山,是火星。然后AI能夠快速理解這個(gè)地名,并進(jìn)行聯(lián)想創(chuàng)意,隨后用藝術(shù)史上杰出畫家的筆法,創(chuàng)作出符合主題的藝術(shù)畫作,并且還能賦詩(shī)一首。

比如,當(dāng)我們輸入“北京”,文心大模型能夠畫出長(zhǎng)城上的明月;輸入“埃及”,可以看到畫作中出現(xiàn)明月下的金字塔;當(dāng)輸入“火星”時(shí),可以看到“祝融號(hào)”火星車的身影。

這個(gè)創(chuàng)意玩法非常有趣,讓我樂(lè)此不疲地給AI出難題。直觀感受是,很多不那么熱門的地名,文心也能準(zhǔn)確識(shí)別,并且找到符合當(dāng)?shù)靥厣木拔?,這顯然需要AI生成能力與知識(shí)儲(chǔ)備的深度融合。再有就是AI作畫能力非常優(yōu)秀,從中可以非常清晰感覺(jué)到歷史上著名畫家的筆法。從印象派到水墨畫,從梵高到畢加索,不僅能模仿著名風(fēng)格和流派,文心甚至可以針對(duì)同一地名,給出畫風(fēng)筆觸截然不同的多幅作品。

相信很多朋友都聽(tīng)說(shuō)過(guò)AI大模型的價(jià)值,但這次是第一次與大模型來(lái)了一次零距離接觸。元宵佳節(jié),你在賞月,而月色中的AI則在認(rèn)真讀懂你意思,為你帶來(lái)一份驚喜。

“詩(shī)畫雙絕”的背后,可以看到文心大模型在AI生成內(nèi)容中,與以往的技術(shù)解決方案有著三項(xiàng)顯著的不同:

1.可以實(shí)現(xiàn)跨模態(tài)轉(zhuǎn)換,能夠根據(jù)語(yǔ)義內(nèi)容生成畫面,完成從語(yǔ)言到視覺(jué)的模態(tài)轉(zhuǎn)換。

2.具有優(yōu)秀的全局觀,生成的內(nèi)容精準(zhǔn)適宜,風(fēng)格協(xié)調(diào)、配色合理,符合藝術(shù)審美。

3.文心完成的“思考等級(jí)”明顯很高,其生成的內(nèi)容復(fù)雜多樣,產(chǎn)生的聯(lián)想豐富,腦力極強(qiáng)。

這三項(xiàng)差異,讓“天下共元宵”的內(nèi)容體驗(yàn)與互動(dòng)效果,較過(guò)去的AI生成內(nèi)容有了顯著提升。而這一絲“月光”,可以照見(jiàn)大模型走向產(chǎn)業(yè),走向應(yīng)用的跨越。

月滿枝頭:文心大模型,照見(jiàn)智能燈火

如果大模型只能在單一領(lǐng)域、單一模態(tài)中完成內(nèi)容生成,那么其價(jià)值也只能在特定領(lǐng)域應(yīng)用,很難與千行百業(yè)的真實(shí)需求相關(guān)聯(lián)。而“天下共元宵”背后的文心大模型,卻以核心技術(shù)突破的方式,讓我們看到了大模型走向強(qiáng)應(yīng)用與泛化場(chǎng)景的“正確打開(kāi)方式”。

百度打造的飛槳文心大模型,全景圖包含NLP(自然語(yǔ)言理解)大模型、CV(計(jì)算機(jī)視覺(jué))大模型、跨模態(tài)大模型,既有基礎(chǔ)通用的大模型,也包含面向重點(diǎn)領(lǐng)域、重點(diǎn)任務(wù)的大模型,以及豐富的工具與平臺(tái)。

而文心大模型的最大差異化,就是其具備“知識(shí)增強(qiáng)”的核心特色,學(xué)習(xí)效率更高、效果更優(yōu),具有通用性好、泛化性強(qiáng)的特點(diǎn)。因此文心大模型可以更加貼近真人對(duì)世界的理解,能夠聽(tīng)懂語(yǔ)言、看懂圖片視頻、理解真實(shí)的世界,并且能夠進(jìn)行對(duì)話、作畫、寫歌詞、續(xù)寫劇本、續(xù)寫小說(shuō)等創(chuàng)作。具體到“天下共元宵”的活動(dòng)中,可以看到文心大模型可以根據(jù)文本自動(dòng)關(guān)聯(lián)地名背后的知識(shí),聯(lián)想出相關(guān)的文化景觀,制作成精美的圖畫;又能夠基于景觀創(chuàng)作出文字內(nèi)容,生成效果驚艷的詩(shī)歌,這就是知識(shí)增強(qiáng)大模型獨(dú)特能力的一次鮮明展示。

而換個(gè)角度看,千行百業(yè)的智能化需求也必然存在兩個(gè)特性:跨模態(tài)和強(qiáng)關(guān)聯(lián)知識(shí)。文心大模型在元宵夜展示的才藝,也正是千家萬(wàn)戶正在這個(gè)夜晚期待著的智能??梢钥吹街R(shí)增強(qiáng)這一核心技術(shù)突破方向,正在驅(qū)動(dòng)著大模型從追求數(shù)據(jù)集效果,走向追求應(yīng)用效果。

這是大模型的跨時(shí)代突破,也是2022年最值得期待的AI發(fā)展方向之一。而從“天下共元宵”當(dāng)中我們甚至可以進(jìn)一步看到,這個(gè)方向并非虛指,而是已經(jīng)有了清晰的具體賽道——這就是正在愈發(fā)火熱的AIGC

月華當(dāng)空:AIGC,相逢即繁華

隨著社交平臺(tái)與流媒體平臺(tái)成為我們須臾不可離身的東西,內(nèi)容創(chuàng)作與傳播成為全球最普遍的價(jià)值生產(chǎn)方式,也筑造了規(guī)模龐大的泛內(nèi)容產(chǎn)業(yè)。

當(dāng)內(nèi)容需求越來(lái)越旺盛,誰(shuí)來(lái)提供內(nèi)容,如何更高效提供內(nèi)容就成為了不變的話題。曾幾何時(shí),UGC、PGC、OGC是互聯(lián)網(wǎng)最熱衷探討的概念。但無(wú)論哪種創(chuàng)作方式,都無(wú)法掩蓋兩個(gè)事實(shí):優(yōu)質(zhì)內(nèi)容永遠(yuǎn)不夠用,優(yōu)質(zhì)內(nèi)容創(chuàng)作非常耗時(shí)耗力。

這種情況下,由AI來(lái)完成或輔助內(nèi)容創(chuàng)作的AIGC就具備不可替代的產(chǎn)業(yè)必然性。快節(jié)奏的內(nèi)容消費(fèi)與生產(chǎn),必然推動(dòng)行業(yè)走向更高強(qiáng)度的自動(dòng)化。其實(shí),AIGC已經(jīng)來(lái)到我們身邊,但其模式相對(duì)單一,基本以生產(chǎn)簡(jiǎn)單文本和TTS聲音合成為主。未來(lái)我們期待且具有價(jià)值的,必然是能夠完成更復(fù)雜創(chuàng)作,能夠讀懂創(chuàng)作者意圖與觀眾訴求,既有靈感,又有知識(shí)的AIGC。

這種情況下,大模型的孕育為AIGC升級(jí)帶來(lái)了堅(jiān)實(shí)的基礎(chǔ)。而具有知識(shí)增強(qiáng)特性的文心大模型,則可以說(shuō)是在大模型與高質(zhì)量AIGC之間,完成了如女足姑娘一樣精彩的“臨門一腳”。

誠(chéng)然,AIGC目前來(lái)看還有非常多需要提高和打磨的空間,但依稀已經(jīng)可以看到這輪明月下,AIGC表現(xiàn)出了可圈可點(diǎn)的發(fā)展?jié)摿?。文心大模型的出現(xiàn),驅(qū)動(dòng)著AIGC向著三個(gè)方向發(fā)生變化:

1.AIGC創(chuàng)作出的內(nèi)容高度個(gè)性化、定制化,具有創(chuàng)意與邏輯感。

2.AIGC將成為創(chuàng)作者的智能助手,大幅提升創(chuàng)作者生產(chǎn)效率,助力內(nèi)容產(chǎn)業(yè)跨越式發(fā)展,實(shí)現(xiàn)內(nèi)容創(chuàng)作與分發(fā)的提質(zhì)增效。

3.AIGC可以與更多的產(chǎn)業(yè)需求、產(chǎn)業(yè)模型相適配,通過(guò)與行業(yè)知識(shí)對(duì)齊融合,AIGC將不僅作用于互聯(lián)網(wǎng)內(nèi)容,還將與工業(yè)設(shè)計(jì)、自動(dòng)化編程、元宇宙、智能辦公等場(chǎng)景結(jié)合,完成生產(chǎn)力的升級(jí)。

為了實(shí)現(xiàn)這些目標(biāo),需要AIGC具有一系列的產(chǎn)業(yè)與技術(shù)前提。其中最重要的是核心技術(shù)成熟;開(kāi)發(fā)與應(yīng)用平臺(tái)完善;實(shí)踐場(chǎng)景豐富。文心大模型帶來(lái)了核心技術(shù)的跨越式突破;而百度打造的飛槳?jiǎng)t提供了完善的AI技術(shù)開(kāi)發(fā)平臺(tái)與大模型使用工具,并且大模型的能力還可以通過(guò)百度智能云等出口賦能行業(yè);百度自身的產(chǎn)品布局,可以帶來(lái)一系列產(chǎn)業(yè)實(shí)踐空間。文心已經(jīng)在百度多個(gè)業(yè)務(wù)線得到了落地應(yīng)用,為未來(lái)打開(kāi)了足夠的想象力。在數(shù)字人與智能視頻合成等方向上,百度帶來(lái)的AIGC能力已經(jīng)可以體系化輸出,并且在冬奧會(huì)等舞臺(tái)上綻放。虛擬數(shù)字人、智能對(duì)話、AI新聞創(chuàng)作、AI圖片生成、AI自動(dòng)剪輯視頻、AI寫詩(shī)等方面都已經(jīng)能夠看到百度提供的AIGC能力。在文心的加持下,下一個(gè)AIGC的可能性或許就由你來(lái)發(fā)掘。多樣化的產(chǎn)業(yè)機(jī)遇,龐大的市場(chǎng)需求,以及盛大的亮相舞臺(tái),讓百度的AIGC布局,中國(guó)的AIGC風(fēng)口,實(shí)現(xiàn)了相遇即繁華的最好狀態(tài)。

天下共元宵的這次活動(dòng),或許是你今年AI之旅的第一站。

AIGC的落地與發(fā)展,或許是大模型擁抱產(chǎn)業(yè)價(jià)值,擁抱大規(guī)模應(yīng)用的第一站。

百度持續(xù)的AI進(jìn)取,或許是中國(guó)AI走向差異化未來(lái),走向自立自強(qiáng)的第一站。

AI生明月,萬(wàn)里共文心。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2022-02-15
AI生明月,萬(wàn)里共文心
具體到“天下共元宵”的活動(dòng)中,可以看到文心大模型可以根據(jù)文本自動(dòng)關(guān)聯(lián)地名背后的知識(shí),聯(lián)想出相關(guān)的文化景觀,制作成精美的圖畫;又能夠基于景觀創(chuàng)作出文字內(nèi)容,生成效果驚艷的詩(shī)歌,這就是知識(shí)增強(qiáng)大模型獨(dú)特能

長(zhǎng)按掃碼 閱讀全文