國內(nèi)AI作曲浪潮再起 網(wǎng)易“醒來”彎道超車?

原標(biāo)題:國內(nèi)AI作曲浪潮再起 網(wǎng)易“醒來”彎道超車?

文/黃康瑄

來源/智能相對論(aixdlun)

“醒來燦爛星光透過了窗臺,海岸線連接了那片山川大海。涌動夢境邊緣像是空曠舞臺,在眼前忽然展開?!笨吹竭@段文字,你的腦海中是否浮現(xiàn)出靛藍(lán)星空風(fēng)云變幻、透出曙光豁然開朗的景象呢?

網(wǎng)易“醒來”

這段文從字順且頗具畫面感的歌詞并非出自人類之手,而是由網(wǎng)易新開發(fā)的人工智能所創(chuàng)作。日前,由網(wǎng)易伏羲、網(wǎng)易雷火音頻部提供作詞、作曲、編曲、演唱等全鏈路AI技術(shù)支持的歌曲《醒來》,在“2020網(wǎng)易未來大會”上正式發(fā)布。這是網(wǎng)易首次完成由AI完全生成的歌曲,從創(chuàng)作到演唱,整首歌曲從無到有僅需一小時。

其實(shí)在此之前,網(wǎng)易一直都在默默進(jìn)行大數(shù)據(jù)平臺、強(qiáng)化學(xué)習(xí)、圖像動作、自然語言處理等圍繞游戲領(lǐng)域的人工智能研究,畢竟游戲才是人家最賺錢的業(yè)務(wù)?!缎褋怼返母柙~創(chuàng)作就是依托于網(wǎng)易游戲伏羲人工智能實(shí)驗(yàn)室較為成熟的語言處理技術(shù)。

網(wǎng)易伏羲利用其自主研發(fā)的“有靈智能創(chuàng)作平臺”,讓AI學(xué)會人類語言組織的基本邏輯。再借助大規(guī)模語料訓(xùn)練實(shí)現(xiàn)端到端的歌詞生成,并通過自研的方法控制不同參數(shù)下的歌詞創(chuàng)作。

有靈平臺的預(yù)訓(xùn)練語言模型可提高歌詞質(zhì)量,確保生成內(nèi)容的流暢性和上下文相關(guān)性。如《醒來》的歌詞內(nèi)容便是為了契合大會主題“洞覺·未見”而編寫的一個關(guān)于AI虛擬人類在深夜蘇醒的故事。

“智能相對論”了解到, 作曲方面,網(wǎng)易伏羲根據(jù)樂理的數(shù)據(jù)分析,形成一套用于生成旋律的算法,可以在短時間內(nèi)排列組合出多個實(shí)用性生成結(jié)果。

編曲則采用雷火音頻部自研的智能編曲引擎,從華語樂壇大量主流歌曲中識別大眾審美偏好,在15-30秒內(nèi)生成一首出版級編曲。而相同質(zhì)量的人工編曲,市場價格在1-1.5萬元左右。網(wǎng)易的此項技術(shù)已具備工業(yè)化大批量生產(chǎn)的能力。真沒想到,一個做游戲起家的公司竟能研發(fā)出如此成熟的AI音樂技術(shù),AIVA和微軟小冰或許將迎來新對手。

除了作詞與編曲,以雷火音頻部提供的大量游戲配音應(yīng)用案例及龐大的歌聲資源為基礎(chǔ),網(wǎng)易伏羲借助神經(jīng)網(wǎng)絡(luò)聲學(xué)模型和聲碼器自動根據(jù)曲譜,實(shí)時生成契合歌曲主題且“幾可亂真”的歌聲,并確?!爸鞒痹诓煌珺PM、風(fēng)格歌譜上音高、節(jié)奏的穩(wěn)定性。

“還可以嘛,不說還聽不出是AI唱的。”“挺像真人的啊!”甚至還有網(wǎng)友從中聽出了張韶涵、鄧紫棋等歌星的“味道”,可見網(wǎng)易AI的歌聲幾乎能以假亂真。不鳴則已,一鳴驚人。

網(wǎng)易云音樂用戶對《醒來》的評價

百度“睜眼”

雖然中國的AI作曲發(fā)展速度不如國外,但近年也算是“多點(diǎn)開花”,逐步落地。在網(wǎng)易之前,騰訊、百度、蝦米等互聯(lián)網(wǎng)公司及音樂平臺都曾在不同程度上對人工智能作曲進(jìn)行探索。

2016年,百度曾通過人工智能識圖作曲技術(shù),將勞森伯格“四分之一英里”畫作中的兩個部分分別譜成鋼琴曲。還讓AI根據(jù)梵高的《星空》、徐悲鴻的《八駿圖》創(chuàng)作樂曲,前者音韻柔和耐人尋味,后者節(jié)奏明快緊張刺激,在一定程度上與畫作意境相符合。但作為第一個成功研發(fā)此項技術(shù)的中國科技公司,百度似乎“志不在此”,并未繼續(xù)探索相關(guān)技術(shù)。

為了趕上百度,騰訊AI Lab也憑借自主研發(fā)的強(qiáng)化學(xué)習(xí)算法,開發(fā)了AI識圖作曲技術(shù),并制作出“把照片唱給你聽”的體驗(yàn)Demo。用戶上傳1到4張圖片后,AI會生成相關(guān)的文字描述并匹配韻腳歌詞,再通過合成語音配合旋律RAP出來。此外,蝦米音樂也在其APP推出了簡易的人工智能作曲功能“探樂行動”,通過讓用戶自行設(shè)定曲風(fēng)、心情、節(jié)拍等參數(shù),自動生成樂曲旋律。

騰訊“開口”

不同于百度和蝦米的淺嘗輒止,騰訊選擇在人工智能作曲的道路上繼續(xù)前進(jìn)。今年六月,騰訊AI Lab推出AI數(shù)字人(Digital Human)“艾靈”,可通過用戶提供的關(guān)鍵詞自動生成歌詞并演唱。

AI艾靈的歌聲是通過分析曲譜與人類說話語音,使用真人聲音訓(xùn)練得到的深度神經(jīng)網(wǎng)絡(luò)聲學(xué)模型和聲碼器模型,可模仿真人聲線合成音頻。

與“初音未來”等虛擬歌姬的“機(jī)器合成,人工調(diào)教”模式不同,AI艾靈使用的DurIAN聲學(xué)模型具有自動調(diào)試的優(yōu)點(diǎn),讓它不需經(jīng)過人工就能生成較“自然”的聲音,還能合成跨語種歌聲。但從聽感上來說,AI艾靈目前的歌聲和真實(shí)人聲還是有點(diǎn)差別。

AI艾靈的歌詞生成則是基于騰訊AI Lab最新研發(fā)的歌詞創(chuàng)作深度學(xué)習(xí)模型SongNet。該模型最大的特點(diǎn)就是可給定任意格式和模板來生成相契合的文本。能對上下文語義和格式同時建模,兼有全局生成和局部精修兩種功能。依靠關(guān)鍵詞創(chuàng)作歌詞的技能就是來源于此。

雖然如此,SongNet模型仍存在局限。約束上下文和蘊(yùn)含特定關(guān)鍵詞的限制會在一定程度上降低模型生成歌詞的邏輯性和連貫性。目前AI艾靈只能生成基礎(chǔ)歌詞和合成歌曲,尚未無法實(shí)現(xiàn)完全自由的創(chuàng)作。

嘗試變現(xiàn)

除了網(wǎng)易與騰訊等互聯(lián)網(wǎng)公司的自主研發(fā),字節(jié)跳動則直接“撿現(xiàn)成”,通過收購Jukedeck的方式入局AI作曲。近年,國內(nèi)一些音樂公司也在此領(lǐng)域孵化出成果,并進(jìn)行了商業(yè)化的嘗試。

如上海若鳶智能科技公司開設(shè)Deepmusic人工智能音樂—全球免版稅音樂生成平臺,為視頻、游戲、音樂等內(nèi)容創(chuàng)作者提供快速制作背景音樂的服務(wù)。北京靈動音科技有限公司(DeepMusic)推出AI作詞和作曲服務(wù),幫助沒有任何音樂專業(yè)知識的普通人也可以輕松地創(chuàng)作出屬于自己的個性化音樂。

版權(quán)內(nèi)容機(jī)構(gòu)HIFIVE(成都嗨翻屋科技有限公司)運(yùn)用AI、大數(shù)據(jù)和云計算技術(shù),為音樂內(nèi)容生產(chǎn)者及使用者提供版權(quán)交易和增值服務(wù),其智能音樂助手小嗨具有聽歌識曲、作曲、作詞三項功能,其網(wǎng)頁版可免費(fèi)使用。

去年上線的“哼趣”APP則利用AI語音識別技術(shù),根據(jù)使用者哼唱的內(nèi)容、音調(diào)、旋律自動生成一段完整的、可編輯的曲子?,F(xiàn)可免費(fèi)下載使用。

國內(nèi)的AI作曲技術(shù)落地已有一段時間,但市場滲透率似乎不高。或許是由于上市時間還不夠長,尚未獲得市場關(guān)注;也可能是因?yàn)镃端市場并沒有想象中廣闊。

對于本身就具備專業(yè)創(chuàng)作能力的音樂人而言,詞曲創(chuàng)作是個人情感表達(dá)與交流的一種方式,將其過程完全假手AI便失去了意義。能自動生成詞曲的AI技術(shù)僅能用來啟發(fā)靈感,并非絕對必要;他們更需要的應(yīng)是現(xiàn)有編曲、錄音軟件和設(shè)備在使用上的智能化,幫助他們提高音樂制作效率。

對創(chuàng)作欲望強(qiáng)烈的音樂小白來說,AI作曲技術(shù)的確能幫忙實(shí)現(xiàn)創(chuàng)作目的,也可作為不錯的娛樂。但若作為收費(fèi)服務(wù),或許會勸退一大批用戶。畢竟業(yè)余愛好者的需求有限,而具有為此消費(fèi)的強(qiáng)烈興趣之人,大多對音樂審美與創(chuàng)作有一定要求,且多半早已付錢學(xué)習(xí)專業(yè)的音樂創(chuàng)作技巧。因此,AI作曲技術(shù)的主要市場,應(yīng)是對音樂生產(chǎn)有大量需求,又沒有太高審美要求的B端。

“智能相對論”了解到,在上述音樂公司中,HIFIVE的商業(yè)化較為成功。To C方面,小嗨可自動生成音樂模板,輔助音樂人以此為基礎(chǔ)進(jìn)行再加工,縮短作品的創(chuàng)作周期。作為一家商用音樂授權(quán)機(jī)構(gòu),HIFIVE的核心業(yè)務(wù)在于對音樂內(nèi)容進(jìn)行確權(quán)、授權(quán),并為品牌、活動、游戲、影視等提供定制音樂服務(wù),并販?zhǔn)郯鏅?quán)。服務(wù)對象仍以B端為主。目前,HIFIVE平臺上已有超過1000首小嗨創(chuàng)作的成品音樂可以用于授權(quán),在廣告配樂或大型活動等特定場合,使用小嗨創(chuàng)作的背景音樂或許具有較高的性價比。

更多可能

不同于音樂公司專注于“老本行”的商業(yè)應(yīng)用,網(wǎng)易與騰訊瞄準(zhǔn)B端市場,嘗試擴(kuò)大AI作曲技術(shù)的應(yīng)用范圍。國內(nèi)能自動生成音樂詞曲內(nèi)容的應(yīng)用雖然不少,但自動合成仿真人聲的技術(shù)屈指可數(shù)。在這方面,網(wǎng)易AI與騰訊AI艾靈的“出道”標(biāo)志著國內(nèi)人工智能作曲技術(shù)的重大進(jìn)步,也比其它國內(nèi)企業(yè)更具優(yōu)勢。

作為數(shù)字虛擬人的AI艾靈除了用于降低歌曲制作錄音環(huán)節(jié)的成本,還能在其聲音合成技術(shù)更加優(yōu)化、更加“逼真”之后,循著小冰框架的路線,用于打造虛擬偶像。目前,AI艾靈在這方面還處于探索階段,尚未出現(xiàn)突破性進(jìn)展。但目前國人對虛擬偶像的喜愛及接受程度遠(yuǎn)不如深受二次元文化影響的日本,虛擬偶像是否能讓AI艾靈成功“破圈”,似乎還需要通過時間和市場來驗(yàn)證。

AI艾靈在B站直播間接受彈幕點(diǎn)歌,和粉絲互動

此外,AI艾靈“規(guī)則明確”的語音合成技術(shù)很適合用于生成游戲解說詞等具有固定內(nèi)容的加工創(chuàng)作。現(xiàn)在,除了Bilibili主播,艾靈還多了“王者榮耀游戲解說”的工作。基于智能數(shù)字人的交互技術(shù),音樂教育方面的應(yīng)用也是AI艾靈未來的探索方向之一。但目前AI教育產(chǎn)業(yè)也仍處于探索階段,AI艾靈在這方面的嘗試可說是摸著石頭過河。

而“唱作俱佳”的網(wǎng)易AI技術(shù)應(yīng)用范圍更加廣泛。除了用于游戲,減少背景音樂、相關(guān)歌曲的開發(fā)時間與成本之外,其達(dá)到工業(yè)化大量生產(chǎn)水平的AI詞曲創(chuàng)作及歌聲合成技術(shù)也可作為一個單獨(dú)的產(chǎn)品。作為網(wǎng)易最新的技術(shù)落地成果,網(wǎng)易目前尚未明確其AI歌曲創(chuàng)作及演唱技術(shù)的商業(yè)化路徑,目前僅將其中的文本生成技術(shù)進(jìn)行商業(yè)化探索。

如作為“AI作詞”技術(shù)支持的“有靈智能創(chuàng)作平臺”開始以“人機(jī)協(xié)同”的創(chuàng)作輔助模式幫助用戶創(chuàng)作詩詞、歌詞與劇本。通過用戶輸入的關(guān)鍵字詞甚至是心情、故事,AI算法就會根據(jù)用戶的需求,自動推薦相關(guān)的場景、意象、畫面,提高文本生成的質(zhì)量;也可直接生成詩詞、歌詞等作品。用戶也可以在創(chuàng)作過程中隨時開啟AI續(xù)寫,還可以提供多種候選段落支持用戶選擇和修改。

AI作詞技術(shù)若面向C端,仍會出現(xiàn)和作曲一樣的“藝術(shù)追求”問題,或許較不利于變現(xiàn)。將這樣的AI文本創(chuàng)作技術(shù)用來為B端批量生產(chǎn)廣告劇本、宣傳歌曲或模式化的品宣文本等似乎更具商業(yè)價值。

目前看來,AI作曲產(chǎn)業(yè)還是一片藍(lán)海,商業(yè)競爭仍以B端市場為主。誰家的AI能以更低的價格,創(chuàng)作出更契合大眾審美的音樂、發(fā)出更符合用戶喜好的歌聲,誰就能取得領(lǐng)先。這種建筑在對人類審美深入理解上的AI技術(shù)優(yōu)化,在降低生產(chǎn)成本的同時,似乎也讓人有些不寒而栗。

隨著人工智能一步步“入侵”藝術(shù)創(chuàng)作領(lǐng)域,網(wǎng)易AI的醒來讓本就渾濁的世界更加難辨真假。在創(chuàng)造者與被創(chuàng)造者皆“期待卻不知未來如何安排”的當(dāng)下,希望未來真的能像網(wǎng)易AI所唱的那樣,終將為我們彼此而喝彩。

參考資料:

1. 網(wǎng)易伏羲實(shí)驗(yàn)室《網(wǎng)易未來大會首發(fā)AI原創(chuàng)單曲<醒來> 唱功媲美專業(yè)歌手》

2. 中國電子報《騰訊緊隨百度完成“AI識圖作曲” 中國人工智能全面崛起》

3. 騰訊AI Lab《唱作俱佳 騰訊AI艾靈領(lǐng)唱中國新兒歌》

*本文圖片均來源于網(wǎng)絡(luò)

此內(nèi)容為【智能相對論】原創(chuàng),

僅代表個人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

部分圖片來自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。

智能相對論(微信ID:aixdlun):

?AI產(chǎn)業(yè)新媒體;

?今日頭條青云計劃獲獎?wù)逿OP10;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能 十萬個為什么》

?【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-12-24
國內(nèi)AI作曲浪潮再起 網(wǎng)易“醒來”彎道超車?
除了作詞與編曲,以雷火音頻部提供的大量游戲配音應(yīng)用案例及龐大的歌聲資源為基礎(chǔ),網(wǎng)易伏羲借助神經(jīng)網(wǎng)絡(luò)聲學(xué)模型和聲碼器自動根據(jù)曲譜,實(shí)時生成契合歌曲主題且“幾可亂真”的歌聲,并確保“主唱”在不同BPM、風(fēng)

長按掃碼 閱讀全文