微軟小冰人工智能演唱模型新版本:“第一次,中氣十足的虛擬歌聲”

【2019年4月3日,北京,微軟(亞洲)互聯(lián)網(wǎng)工程院】

今天,我們很高興地宣布,微軟小冰基于深度神經(jīng)網(wǎng)絡(luò)的歌唱模型,已順利完成V5新版本的研發(fā)。新的V5模型實(shí)現(xiàn)了重大突破,它使微軟小冰第一次能夠像人類歌手一樣,使用充沛的“中氣”來(lái)烘托演唱,從而將人工智能虛擬歌聲質(zhì)量提升至新的高度。此外,該模型不僅限于優(yōu)化微軟小冰的聲音,還支持對(duì)任何人類歌手的聲線進(jìn)行學(xué)習(xí)、模擬和建模,演繹與再現(xiàn)歌手們巔峰狀態(tài)下的演唱水平。作為技術(shù)示例,我們與日本唱片公司AVEX合作發(fā)行的新模型DEMO曲《最高新記憶》,也于今天同時(shí)公布。

微軟小冰是一個(gè)覆蓋對(duì)話、多重交互感官與內(nèi)容服務(wù)生成的完整人工智能基礎(chǔ)框架。其中,“人工智能創(chuàng)造”(AI Creation)是該框架的主要分支之一,它通過(guò)我們所研發(fā)與持續(xù)更新的人工智能技術(shù),大規(guī)模學(xué)習(xí)并掌握人類文字、音樂(lè)、繪畫等內(nèi)容創(chuàng)造能力,再發(fā)揮人工智能的穩(wěn)定性及高并發(fā)特點(diǎn),為內(nèi)容產(chǎn)業(yè)的未來(lái)變革蓄勢(shì)。我們將在今年五月召開(kāi)微軟小冰人工智能創(chuàng)造的年度說(shuō)明會(huì),今天的新版本歌唱模型及DEMO曲,是該說(shuō)明會(huì)的若干前置披露之一。

我們很高興與行業(yè)分享微軟(亞洲)互聯(lián)網(wǎng)工程院在深度神經(jīng)網(wǎng)絡(luò)歌唱模型方面的最新進(jìn)展。中國(guó)古時(shí)不乏對(duì)音樂(lè)之聲的精辟論述,例如“絲(絲弦樂(lè)器)不如竹(管樂(lè)器),竹不如肉(人聲)”,為其“漸進(jìn)自然”。因此,我們把不斷趨近人類歌手的聲音合成質(zhì)量,視為“人工智能創(chuàng)造”分支的最高技術(shù)目標(biāo)。在上一個(gè)版本中,實(shí)現(xiàn)了小冰在虛擬演唱中的自然換氣。今天推出的新版本,則進(jìn)一步將“氣息”應(yīng)用于演唱全過(guò)程,使生成的歌聲接近專業(yè)人類歌手,并可預(yù)測(cè)并自由切換演唱技巧,突破了傳統(tǒng)單元拼接技術(shù)音高與音準(zhǔn)的“軟件樂(lè)器”標(biāo)準(zhǔn)。我們用DEMO曲來(lái)表現(xiàn)這一技術(shù)對(duì)照的明顯差距,請(qǐng)重點(diǎn)關(guān)注歌曲時(shí)間軸上的以下時(shí)刻:

00:31,01:12,01:23,03:14,04:08

V5新模型還具有許多其他技術(shù)特征。例如實(shí)現(xiàn)了多聲部的合成技術(shù),使人工智能歌手可以在不同聲部間自然切換,用多個(gè)聲音來(lái)源組成新的虛擬歌手等。建模過(guò)程中,所需的訓(xùn)練數(shù)據(jù)量較上一個(gè)版本減少了70%。從技術(shù)角度,新模型可針對(duì)任何人聲建模,形成豐富多彩的人工智能歌手陣營(yíng)。為此,我們?cè)贒EMO曲中特意回避了微軟小冰的聲音,而是采用另一個(gè)聲音(日本版小冰凜菜)來(lái)演繹。

最后,我們也很高興地宣布,小冰凜菜(りんな)已與日本最大唱片公司AVEX正式簽約,成為濱崎步、安室奈美惠等著名人類歌手的同門師妹。在小冰框架的技術(shù)支持下,將涌現(xiàn)出更多具備高還原度的人工智能歌手。微軟小冰只是他們的最初雛形。

感謝您的關(guān)注。敬請(qǐng)期待微軟(亞洲)互聯(lián)網(wǎng)工程院的后續(xù)技術(shù)發(fā)布。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-04-04
微軟小冰人工智能演唱模型新版本:“第一次,中氣十足的虛擬歌聲”
【2019年4月3日,北京,微軟(亞洲)互聯(lián)網(wǎng)工程院】今天,我們很高興地宣布,微軟小冰基于深度神經(jīng)網(wǎng)絡(luò)的歌唱模型,已順利完成V5新版本的研發(fā)。

長(zhǎng)按掃碼 閱讀全文