百度推“DeepVoice”最終版:半小時(shí)即可學(xué)會(huì)一種口音

最近,百度終于推出了DeepVoice的“最終版”,并聲稱最終版可以在每半個(gè)小時(shí)內(nèi)完成對(duì)10000種語(yǔ)音的數(shù)據(jù)學(xué)習(xí)。

百度推“DeepVoice”最終版,半小時(shí)即可學(xué)會(huì)一種口音

DeepVoice作為一個(gè)完全有深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的高質(zhì)量語(yǔ)音轉(zhuǎn)文本系統(tǒng),能夠用于智能手機(jī)地圖與語(yǔ)音軟件;能夠?qū)崿F(xiàn)游戲角色由玩家自己合成聲音,從而替代原聲配音;還能夠用于音樂(lè)合成供娛樂(lè)消遣。但目前百度DeepVoice產(chǎn)出的口音,其合成感還是很明顯。

百度于今年2月份推出的DeepVoice第一代,與神經(jīng)文本到語(yǔ)音(TTS)系統(tǒng)不同,它只能學(xué)習(xí)較短的句子,并且系統(tǒng)每次只能學(xué)習(xí)一種聲音,在數(shù)個(gè)小時(shí)后才能掌握。

在今年5月份推出的DeepVoice2,模仿口音時(shí)間有所提高,大約一個(gè)小時(shí)內(nèi)即可模仿出一種口音。單系統(tǒng)即可以學(xué)習(xí)數(shù)百種不同的口音,同時(shí)實(shí)現(xiàn)高音質(zhì)。

百度推“DeepVoice”最終版,半小時(shí)即可學(xué)會(huì)一種口音

如今推出的DeepVoice最終版,效率極大提高,可以在半個(gè)小時(shí)內(nèi)完成對(duì)10000種語(yǔ)音數(shù)據(jù)的學(xué)習(xí)。但是,百度表示“最終版”仍然有進(jìn)步空間,他們要制造出一種能夠掌握多種口音或能捕捉字符間細(xì)微差別的系統(tǒng),以使得語(yǔ)音合成系統(tǒng)用處更廣泛,學(xué)習(xí)聲音真實(shí)程度更高,錯(cuò)誤率降低。

除了百度之外,Google、Apple和Amazon都有相關(guān)的語(yǔ)音合成研發(fā)產(chǎn)品。Google旗下的DeepMind,一直在進(jìn)行一個(gè)名叫WaveNet的類似項(xiàng)目。最新版本的WaveNet已經(jīng)能夠在掌握口音方面做到真實(shí)、高效,甚至可以像真人那樣產(chǎn)生“唇音”??梢?jiàn),百度的語(yǔ)音合成軟件的研發(fā)之路還很長(zhǎng)遠(yuǎn)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2017-10-25
百度推“DeepVoice”最終版:半小時(shí)即可學(xué)會(huì)一種口音
最近,百度終于推出了DeepVoice的“最終版”,并聲稱最終版可以在每半個(gè)小時(shí)內(nèi)完成對(duì)10000種語(yǔ)音的數(shù)據(jù)學(xué)習(xí)。

長(zhǎng)按掃碼 閱讀全文