微軟自定義神經(jīng)語音技術(shù)已允許用戶創(chuàng)建高度逼真、類似于人類的聲音

據(jù)微軟官方發(fā)布,近期,Azure 認(rèn)知服務(wù)中的語音服務(wù)的一部分——自定義神經(jīng)語音 (Custom Neural Voice)——文本到語音功能已普遍推出。該功能將允許用戶使用微軟開創(chuàng)性的神經(jīng)文本到語音模型,為應(yīng)用創(chuàng)建高度逼真、類似人類的自定義語音。由于創(chuàng)建的語音非常逼真,微軟限制了訪問權(quán)限,以便用戶負(fù)責(zé)任地使用這項(xiàng)技術(shù)。

微軟表示,“作為微軟對(duì)負(fù)責(zé)任的人工智能承諾的一部分,我們?cè)O(shè)計(jì)和發(fā)布自定義神經(jīng)語音的目的是保護(hù)個(gè)人和社會(huì)的權(quán)利,促進(jìn)透明的人機(jī)交互,抵制有害的深層偽裝和誤導(dǎo)性內(nèi)容的擴(kuò)散。為此,我們對(duì)自定義神經(jīng)語音的訪問和使用進(jìn)行了限制。”

IT之家獲悉,要?jiǎng)?chuàng)建自定義語音,你只需錄制音頻并上傳作為訓(xùn)練數(shù)據(jù)即可。Azure 語音服務(wù)將為你的錄音創(chuàng)建一個(gè)獨(dú)特的語音調(diào)整。自定義神經(jīng)語音的聲音逼真自然,可以代表品牌,讓用戶以自然的方式與應(yīng)用進(jìn)行對(duì)話互動(dòng)。

微軟強(qiáng)調(diào),以下客戶已經(jīng)在使用這項(xiàng)最新的 TTS 功能。

AT&T / 華納兄弟:他們最近在德克薩斯州達(dá)拉斯的 AT&T 體驗(yàn)店推出了一個(gè)首創(chuàng)的創(chuàng)意和互動(dòng)體驗(yàn),客戶可以直接與兔八哥對(duì)話。

Progressive:利用標(biāo)志性的 Progressive 保險(xiǎn)發(fā)言人 Flo 的聲音,創(chuàng)建了 Flo 聊天機(jī)器人,以簡(jiǎn)化客戶咨詢流程,提供個(gè)性化體驗(yàn)。

Duolingo:為了讓學(xué)習(xí)一門新的語言感到可實(shí)現(xiàn)性和適用性,Duolingo 使用課程創(chuàng)建了多樣化的風(fēng)格化聲音。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-03-04
微軟自定義神經(jīng)語音技術(shù)已允許用戶創(chuàng)建高度逼真、類似于人類的聲音
微軟自定義神經(jīng)語音技術(shù)已允許用戶創(chuàng)建高度逼真、類似于人類的聲音,據(jù)微軟官方發(fā)布,近期,Azure 認(rèn)知服務(wù)中的語音服務(wù)的一部分自定義神經(jīng)語音 (Custom Neu

長(zhǎng)按掃碼 閱讀全文