AI超擬真有聲書《智能交通》上線,AIGC打開(kāi)新想象空間

4月21日消息(南山)快節(jié)奏、碎片化的現(xiàn)代生活,發(fā)達(dá)的互聯(lián)網(wǎng)技術(shù),使得聽(tīng)有聲書成為讀書的一種流行形式。更令人意想不到的是,有聲書還可以用AI技術(shù)創(chuàng)作。

4.23世界讀書日前夕,喜馬拉雅上線了AI超擬真有聲書《智能交通》。這套有聲書共86集,每集時(shí)長(zhǎng)10-20分鐘,首日上線21集,后續(xù)每天更新2集。據(jù)了解,用戶在百度搜索“智能交通有聲書”,可直接收聽(tīng)。

《智能交通》是百度董事長(zhǎng)兼CEO李彥宏出版的一本著作,去年12月發(fā)行。百度語(yǔ)音合成團(tuán)隊(duì)基于《智能交通》一書20萬(wàn)字文本,使用李彥宏約1小時(shí)音頻素材,通過(guò)AIGC(人工智能創(chuàng)作內(nèi)容)技術(shù)生成了《智能交通》有聲書。其音頻合成效果還原度極高,普通用戶聽(tīng)到的,幾乎就是“原聲”,難以分辨,也無(wú)需分辨。

“原聲創(chuàng)作”展示了百度強(qiáng)悍的AI語(yǔ)音合成能力,也從一個(gè)側(cè)面反映出AI技術(shù)正在加速滲透且改變?nèi)祟惿鐣?huì)。以《智能交通》有聲書為例,一方面是AIGC(人工智能創(chuàng)作內(nèi)容)的興起,另一方面其本身蘊(yùn)含的內(nèi)容,是李彥宏對(duì)AI深度變革交通出行行業(yè)的解讀:自動(dòng)駕駛不是夢(mèng),交通擁堵不再怕,交通事故不斷下降……

互聯(lián)網(wǎng)上近年有一句話很流行:“你要悄悄努力,然后驚艷所有人。”AI,從最開(kāi)始的掙扎,悄然間已遍布各行各業(yè),很快將驚艷所有人。

Part1:AI超擬真有聲書《智能交通》是如何創(chuàng)作的?

《智能交通》顧名思義,是一本講述交通行業(yè)智能化現(xiàn)狀與未來(lái)的專業(yè)書籍,涉及不同的表達(dá)語(yǔ)境、相當(dāng)多的中英文專業(yè)詞匯。據(jù)了解,百度語(yǔ)音合成團(tuán)隊(duì)只采用了李彥宏約1小時(shí)公開(kāi)音頻,可用數(shù)據(jù)約300句且口語(yǔ)化,場(chǎng)景單一且沒(méi)有英文詞匯。以常用語(yǔ)言為基礎(chǔ),創(chuàng)作專業(yè)版的有聲書,這種極致的對(duì)比,可以直觀凸顯“地獄級(jí)”的難度。

您的瀏覽器不支持本音頻元素,請(qǐng)更新瀏覽器。

▲《智能交通》有聲書音頻片段

挑戰(zhàn)主要有四點(diǎn):如何只利用300句數(shù)據(jù),高度還原說(shuō)話風(fēng)格;如何只利用中文數(shù)據(jù),合成出音色、風(fēng)格一致的中、英文混合播報(bào)效果;如何只利用單一的訪談口語(yǔ)化數(shù)據(jù),合成出專業(yè)和敘述等其它語(yǔ)境下內(nèi)容,保證其流暢性和自然度;如何利用發(fā)音不標(biāo)準(zhǔn)的數(shù)據(jù),合成出高音質(zhì)、高還原度,發(fā)音準(zhǔn)確穩(wěn)定的效果。

團(tuán)隊(duì)一一提供了針對(duì)性解決方案:率先研發(fā)的端到端細(xì)粒度建模技術(shù),從300個(gè)整句的學(xué)習(xí),進(jìn)化到300句乘以每句20個(gè)字的學(xué)習(xí)方式,更好的挖掘了字與字之間的相互關(guān)系,更加高效的利用了數(shù)據(jù)?;谠摷夹g(shù),個(gè)性化合成只9句即可實(shí)現(xiàn)普通效果,300句已達(dá)到專業(yè)水準(zhǔn)。

獨(dú)創(chuàng)的解耦式建模技術(shù),可以對(duì)說(shuō)話的內(nèi)容、風(fēng)格、音色進(jìn)行區(qū)分,并獨(dú)立建模;通過(guò)大數(shù)據(jù)的學(xué)習(xí),將學(xué)習(xí)到的三個(gè)維度能力進(jìn)行遷移。從而達(dá)到讓一個(gè)不會(huì)說(shuō)英文的人,也可以正確的讀出英文。此外也可以將風(fēng)格能力遷移到特定人身上,例如講故事。

此外,前后端聯(lián)合建模技術(shù),依托百度在語(yǔ)言處理的優(yōu)勢(shì),結(jié)合文本處理與發(fā)音合成兩大模塊,聯(lián)合學(xué)習(xí)了大量不同文本語(yǔ)境下的發(fā)音方式,實(shí)現(xiàn)跨語(yǔ)境合成;獨(dú)創(chuàng)的通用聲碼器合成技術(shù),結(jié)合了傳統(tǒng)參數(shù)聲碼器的可控以及神經(jīng)網(wǎng)絡(luò)聲碼器的高還原度優(yōu)勢(shì),修復(fù)錯(cuò)誤發(fā)音和提升音頻質(zhì)量,有效解決口語(yǔ)環(huán)境下存在的發(fā)音不標(biāo)準(zhǔn)的問(wèn)題。

目前,只需9句話素材、5分鐘等待,百度語(yǔ)音合成技術(shù)即可實(shí)現(xiàn)對(duì)用戶聲音的復(fù)刻,300句話即可生成媲美專業(yè)音庫(kù)的音頻內(nèi)容。作為業(yè)內(nèi)唯一能提供10句話以內(nèi)大規(guī)模產(chǎn)品級(jí)個(gè)性化語(yǔ)音合成服務(wù)的公司,百度相關(guān)技術(shù)早已應(yīng)用于各類產(chǎn)品中,如在百度地圖吸引超過(guò)600位明星紅人入駐語(yǔ)音廣場(chǎng),實(shí)現(xiàn)個(gè)性化定制語(yǔ)音包,每日播放次數(shù)達(dá)2億。

通過(guò)《智能交通》的創(chuàng)作,可以看到AIGC技術(shù)的進(jìn)化,已經(jīng)能夠解決一些看似無(wú)法解決的難題,從而在技術(shù)層面掃除障礙。創(chuàng)作者基于AI技術(shù)平臺(tái),可以將精力聚焦于內(nèi)容本身,從而大大解放了生產(chǎn)力,為行業(yè)發(fā)展帶來(lái)了光明前景。百度的各類“率先”、“獨(dú)創(chuàng)”技術(shù),則證明了其在AI語(yǔ)音合成領(lǐng)域的江湖地位。

Part2:《智能交通》講述了什么?

如果說(shuō)AI有聲書反映了AI技術(shù)在新興領(lǐng)域的創(chuàng)造力,那么智能交通就是AI技術(shù)深刻變革傳統(tǒng)行業(yè)的代表?!吨悄芙煌ā愤@本書中,李彥宏從關(guān)注自動(dòng)駕駛解決安全問(wèn)題開(kāi)始,一點(diǎn)一點(diǎn)深入,也一點(diǎn)一點(diǎn)放大關(guān)注的尺度——關(guān)注人類司機(jī)危險(xiǎn)駕駛的問(wèn)題以及自動(dòng)駕駛、智能交通、智慧城市等問(wèn)題。

比如,將交通事故率降低90%;根據(jù)國(guó)際公路安全協(xié)會(huì)發(fā)布的數(shù)據(jù),每年約有135萬(wàn)人死于交通事故,降低90%就可以減少百萬(wàn)人死亡。再如,助力國(guó)家“3060”雙碳目標(biāo)達(dá)成,交通是非常重要的一環(huán)。建設(shè)未來(lái)的智慧城市,智能交通也是重要組成部分。李彥宏認(rèn)為,智能交通系統(tǒng)可以提高通行效率,節(jié)約能源,降低空氣污染的水平,幫助碳達(dá)峰和碳中和,惠及每一個(gè)有出行需求的人。

如果說(shuō)這是《智能交通》一書創(chuàng)作的初衷,那么其中探討的內(nèi)容,更是全景式展現(xiàn)了人工智能技術(shù)的價(jià)值。聰明的車、智慧的路,構(gòu)筑完整的車路協(xié)同系統(tǒng),李彥宏判斷,智能交通將是影響未來(lái)10-40年的重大變革,10年之內(nèi),依托交通效率提升,城市擁堵問(wèn)題將基本解決。

C114留意到,《智能交通》出版上市,受到了眾多知名人士和知名媒體的好評(píng)。例如中國(guó)工程院院士、國(guó)家新一代人工智能戰(zhàn)略咨詢委員會(huì)主任潘云鶴作序表示,“智能交通是一個(gè)兼具深度和廣度的智能大系統(tǒng),書中相關(guān)創(chuàng)新研究和實(shí)踐,一定能推動(dòng)和引領(lǐng)國(guó)內(nèi)外智能交通的新發(fā)展。”

用AI技術(shù)基于本書創(chuàng)作的有聲書,值得一聽(tīng)。對(duì)行業(yè)人士來(lái)說(shuō),堪稱“雙倍智能”的體驗(yàn)。

Part3:顛覆AIGC,顛覆智能交通

百度在AI領(lǐng)域擁有宏偉的布局,僅從這套AI有聲書,就可以窺見(jiàn)其在兩個(gè)垂直領(lǐng)域的雄心:顛覆AIGC、顛覆智能交通。

AIGC來(lái)看,當(dāng)前市面流行的內(nèi)容,無(wú)論是從制作方式還是內(nèi)容本身都較為粗淺,僅僅是人工制作內(nèi)容的補(bǔ)充,遠(yuǎn)遠(yuǎn)稱不上主流。AI有聲書《智能交通》由于內(nèi)容的專業(yè)性,很難成為爆款產(chǎn)品,但其采用AI技術(shù)制作的精英級(jí)水準(zhǔn),顯示出AIGC產(chǎn)業(yè)具有巨大潛力和可兌現(xiàn)能力,百度將扮演重要角色。

智能交通領(lǐng)域更加能夠全方位考驗(yàn)一家人工智能公司的全棧式能力、深度學(xué)習(xí)水平、行業(yè)解決方案的價(jià)值與綜合社會(huì)效益。百度作為一家人工智能公司,在智能交通領(lǐng)域起步早、投資大、態(tài)度堅(jiān)決,早已處于領(lǐng)軍者地位。

一方面,百度是全球領(lǐng)先的自動(dòng)駕駛技術(shù)開(kāi)發(fā)商,不僅推出自動(dòng)駕駛開(kāi)放平臺(tái)Apollo,還推出了自動(dòng)駕駛出行服務(wù)平臺(tái)蘿卜快跑;另一方面,百度深入?yún)⑴c到全國(guó)智能交通的建設(shè)中,支持多個(gè)國(guó)家級(jí)車聯(lián)網(wǎng)先導(dǎo)區(qū)和各省市先導(dǎo)區(qū)的高質(zhì)量發(fā)展,從自動(dòng)駕駛,走向自動(dòng)駕駛和車路協(xié)同的全面發(fā)展。

百度在智能交通領(lǐng)域的深度實(shí)踐,正推動(dòng)人工智能技術(shù)的產(chǎn)業(yè)化進(jìn)行一次高級(jí)別的、高價(jià)值的、高技術(shù)含量的驗(yàn)證。而在AIGC領(lǐng)域的小試牛刀,也為行業(yè)注入了一股技術(shù)創(chuàng)新力,將攪動(dòng)這一池春水,等待著內(nèi)容創(chuàng)作者的熱情回應(yīng)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2022-04-21
AI超擬真有聲書《智能交通》上線,AIGC打開(kāi)新想象空間
AI超擬真有聲書《智能交通》上線,AIGC打開(kāi)新想象空間,C114訊 4月21日消息(南山)快節(jié)奏、碎片化的現(xiàn)代生活,發(fā)達(dá)的互聯(lián)網(wǎng)技術(shù),使得聽(tīng)有聲書成為讀書的

長(zhǎng)按掃碼 閱讀全文