以假亂真,天工音樂大模型帶來顛覆式AI體驗(yàn)

昨日,昆侖萬維AI音樂生成大模型「天工SkyMusic」開啟了免費(fèi)邀測活動,誠邀媒體、行業(yè)專家以及感興趣的音樂從業(yè)者們共同體驗(yàn)人聲情感表達(dá) SOTA 的音樂大模型產(chǎn)品。

邀測開始后,廣大用戶對「天工SkyMusic」AI音樂生成大模型的熱情遠(yuǎn)超我們的預(yù)期,工作人員在極短時間內(nèi)收到了幾十萬份測試申請,其中包括眾多專業(yè)的音樂創(chuàng)作人、媒體及行業(yè)專家,還有大量測試申請被源源不斷地發(fā)至后臺。

同時,我們也收到了大量來自用戶的真實(shí)反饋與高度評價:

“人聲很清晰 抒情旋律也好”

“好聽!”

“這是天工做的??太厲害了!”

“《悟空》這首歌是演唱?dú)庀⒏械?,感情很到位,基本上代表了生成情感以假亂真的能力巔峰之作”

“天工SkyMusic在高音演唱技巧上超出我的想象,非常優(yōu)秀。”

“太強(qiáng)了,1、AI音樂用戶群體非常大;2、生成的音樂可以反復(fù)使用;3、很容易做社交裂變”

“副歌部分真絲滑,Beat真好”

“沒想到中國團(tuán)隊做的東西比國外的好”

廣大用戶的熱情反饋既然讓我們看到了行業(yè)對于「天工SkyMusic」AI音樂生成大模型的高度期待,也讓我們看到了在以“智力”為主的AGI大模型探索方向中,“情感AGI”的重要意義。

相比文本和圖片,音頻內(nèi)容是理解人類情感最好的方式,而音樂又是人類情感表達(dá)最充沛、最不受地域和文化限制的內(nèi)容載體,不論時代變幻,不論是戰(zhàn)爭還是災(zāi)禍,人們總是能通過音樂傳遞自己的感受并獲得情感的慰藉。這是「天工SkyMusic」的創(chuàng)作初衷,也是昆侖萬維情感AGI持續(xù)探索的重要方向。

我們感謝所有積極參與并熱情反饋的用戶們,感謝你們的支持、鼓勵與陪伴,我們將持續(xù)迭代、優(yōu)化、拓寬「天工SkyMusic」的能力邊界,讓模型具備更強(qiáng)的多模態(tài)情感理解與表達(dá)能力,為用戶帶來更優(yōu)質(zhì)的AI音樂體驗(yàn)。

最后,我們將很快給出「天工SkyMusic」音樂創(chuàng)作Prompt指南,并提供更多的AI音樂Demo與使用技巧,與用戶一同探索AI音樂的強(qiáng)大魅力!

關(guān)于「天工SkyMusic」與「天工3.0」

「天工SkyMusic」AI音樂生成大模型基于昆侖萬維「天工3.0」超級大模型打造。4月17日,「天工SkyMusic」將隨「天工3.0」同步開啟公測。

申請網(wǎng)頁:http://ygpos.cn/uploadfile/pic2020/2024/0403/20240403104003152G Transformer 負(fù)責(zé)譜曲,來學(xué)習(xí) Music Patches 的上下文依賴關(guān)系,同時完成音樂可控性;Diffusion Transformer 負(fù)責(zé)演唱,通過LDM讓Music Patches被還原成高質(zhì)量音頻,使得「天工SkyMusic」能夠支持生成80秒44100Hz 采樣率雙聲道立體聲歌曲。這套模型架構(gòu)在處理視頻、音頻和音樂領(lǐng)域效果極佳。昆侖萬維團(tuán)隊也將在后續(xù)逐步迭代和添加新的能力,讓模型具備多模態(tài)的情感理解與表達(dá)能力。

「天工SkyMusic」測試申請網(wǎng)頁:http://ygpos.cn/uploadfile/pic2020/2024/0403/20240403104003153G 高質(zhì)量AI音樂

「天工SkyMusic」能夠生成80秒44100Hz采樣率雙聲道立體聲AI歌曲,并可根據(jù)用戶輸入的歌詞風(fēng)格生成對應(yīng)歌曲風(fēng)格。

2. 人聲“以假亂真”

人聲合成是AI音樂生成中最重要、最能體現(xiàn)生成效果和品質(zhì)的維度?!柑旃kyMusic」的AI人聲合成能夠達(dá)到業(yè)內(nèi)頂尖的SOTA水平,中文水平極為優(yōu)秀,發(fā)音清晰、無異響。其中文演唱效果更是顯著好于國外產(chǎn)品,領(lǐng)先世界水平。

3. 歌詞段落控制

「天工SkyMusic」能夠通過歌詞來控制歌曲,讓生成的歌曲可以明確分辨出不同歌詞段落的情緒變化,體現(xiàn)出主歌和副歌、前奏和主歌的段落差異。

4. 多種音樂風(fēng)格

「天工SkyMusic」支持說唱、民謠、放克、古風(fēng)、電子等多種音樂風(fēng)格,用戶在創(chuàng)作音樂時,可以通過參考音頻制定想要的音樂風(fēng)格。

5. 音樂智能表達(dá) - 歌唱技巧學(xué)習(xí)

「天工SkyMusic」同時能夠?qū)W習(xí)如顫音、歌劇、吟唱、男女對唱,自動和聲等多種歌唱技巧,讓用戶創(chuàng)作的歌曲得到更恰當(dāng)?shù)那楦斜磉_(dá)。

2023 年,昆侖萬維在 “All in AGI 和 AIGC” 的戰(zhàn)略推動下,在人工智能領(lǐng)域取得了許多進(jìn)展,逐步形成了AI大模型、AI搜索、AI音樂、AI動漫、AI 社交、AI游戲等AI業(yè)務(wù)矩陣。

當(dāng)前,昆侖萬維已打造了集AI搜索、AI寫作、AI長文本閱讀、AI對話、AI語音合成、AI圖片生成、AI漫畫創(chuàng)作、AI圖片識別、AI音樂生成、AI代碼寫作、AI表格生成等多項(xiàng)能力于一體的「天工3.0」多模態(tài)“超級模型”(Super Model),成為AI行業(yè)全新里程碑。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )