4月21日消息(南山)快節(jié)奏、碎片化的現(xiàn)代生活,發(fā)達(dá)的互聯(lián)網(wǎng)技術(shù),使得聽有聲書成為讀書的一種流行形式。更令人意想不到的是,有聲書還可以用AI技術(shù)創(chuàng)作。
4.23世界讀書日前夕,喜馬拉雅上線了AI超擬真有聲書《智能交通》。這套有聲書共86集,每集時長10-20分鐘,首日上線21集,后續(xù)每天更新2集。據(jù)了解,用戶在百度搜索“智能交通有聲書”,可直接收聽。
《智能交通》是百度董事長兼CEO李彥宏出版的一本著作,去年12月發(fā)行。百度語音合成團(tuán)隊基于《智能交通》一書20萬字文本,使用李彥宏約1小時音頻素材,通過AIGC(人工智能創(chuàng)作內(nèi)容)技術(shù)生成了《智能交通》有聲書。其音頻合成效果還原度極高,普通用戶聽到的,幾乎就是“原聲”,難以分辨,也無需分辨。
“原聲創(chuàng)作”展示了百度強(qiáng)悍的AI語音合成能力,也從一個側(cè)面反映出AI技術(shù)正在加速滲透且改變?nèi)祟惿鐣?。以《智能交通》有聲書為例,一方面是AIGC(人工智能創(chuàng)作內(nèi)容)的興起,另一方面其本身蘊含的內(nèi)容,是李彥宏對AI深度變革交通出行行業(yè)的解讀:自動駕駛不是夢,交通擁堵不再怕,交通事故不斷下降……
互聯(lián)網(wǎng)上近年有一句話很流行:“你要悄悄努力,然后驚艷所有人。”AI,從最開始的掙扎,悄然間已遍布各行各業(yè),很快將驚艷所有人。
Part1:AI超擬真有聲書《智能交通》是如何創(chuàng)作的?
《智能交通》顧名思義,是一本講述交通行業(yè)智能化現(xiàn)狀與未來的專業(yè)書籍,涉及不同的表達(dá)語境、相當(dāng)多的中英文專業(yè)詞匯。據(jù)了解,百度語音合成團(tuán)隊只采用了李彥宏約1小時公開音頻,可用數(shù)據(jù)約300句且口語化,場景單一且沒有英文詞匯。以常用語言為基礎(chǔ),創(chuàng)作專業(yè)版的有聲書,這種極致的對比,可以直觀凸顯“地獄級”的難度。
您的瀏覽器不支持本音頻元素,請更新瀏覽器。
▲《智能交通》有聲書音頻片段
挑戰(zhàn)主要有四點:如何只利用300句數(shù)據(jù),高度還原說話風(fēng)格;如何只利用中文數(shù)據(jù),合成出音色、風(fēng)格一致的中、英文混合播報效果;如何只利用單一的訪談口語化數(shù)據(jù),合成出專業(yè)和敘述等其它語境下內(nèi)容,保證其流暢性和自然度;如何利用發(fā)音不標(biāo)準(zhǔn)的數(shù)據(jù),合成出高音質(zhì)、高還原度,發(fā)音準(zhǔn)確穩(wěn)定的效果。
團(tuán)隊一一提供了針對性解決方案:率先研發(fā)的端到端細(xì)粒度建模技術(shù),從300個整句的學(xué)習(xí),進(jìn)化到300句乘以每句20個字的學(xué)習(xí)方式,更好的挖掘了字與字之間的相互關(guān)系,更加高效的利用了數(shù)據(jù)。基于該技術(shù),個性化合成只9句即可實現(xiàn)普通效果,300句已達(dá)到專業(yè)水準(zhǔn)。
獨創(chuàng)的解耦式建模技術(shù),可以對說話的內(nèi)容、風(fēng)格、音色進(jìn)行區(qū)分,并獨立建模;通過大數(shù)據(jù)的學(xué)習(xí),將學(xué)習(xí)到的三個維度能力進(jìn)行遷移。從而達(dá)到讓一個不會說英文的人,也可以正確的讀出英文。此外也可以將風(fēng)格能力遷移到特定人身上,例如講故事。
此外,前后端聯(lián)合建模技術(shù),依托百度在語言處理的優(yōu)勢,結(jié)合文本處理與發(fā)音合成兩大模塊,聯(lián)合學(xué)習(xí)了大量不同文本語境下的發(fā)音方式,實現(xiàn)跨語境合成;獨創(chuàng)的通用聲碼器合成技術(shù),結(jié)合了傳統(tǒng)參數(shù)聲碼器的可控以及神經(jīng)網(wǎng)絡(luò)聲碼器的高還原度優(yōu)勢,修復(fù)錯誤發(fā)音和提升音頻質(zhì)量,有效解決口語環(huán)境下存在的發(fā)音不標(biāo)準(zhǔn)的問題。
目前,只需9句話素材、5分鐘等待,百度語音合成技術(shù)即可實現(xiàn)對用戶聲音的復(fù)刻,300句話即可生成媲美專業(yè)音庫的音頻內(nèi)容。作為業(yè)內(nèi)唯一能提供10句話以內(nèi)大規(guī)模產(chǎn)品級個性化語音合成服務(wù)的公司,百度相關(guān)技術(shù)早已應(yīng)用于各類產(chǎn)品中,如在百度地圖吸引超過600位明星紅人入駐語音廣場,實現(xiàn)個性化定制語音包,每日播放次數(shù)達(dá)2億。
通過《智能交通》的創(chuàng)作,可以看到AIGC技術(shù)的進(jìn)化,已經(jīng)能夠解決一些看似無法解決的難題,從而在技術(shù)層面掃除障礙。創(chuàng)作者基于AI技術(shù)平臺,可以將精力聚焦于內(nèi)容本身,從而大大解放了生產(chǎn)力,為行業(yè)發(fā)展帶來了光明前景。百度的各類“率先”、“獨創(chuàng)”技術(shù),則證明了其在AI語音合成領(lǐng)域的江湖地位。
Part2:《智能交通》講述了什么?
如果說AI有聲書反映了AI技術(shù)在新興領(lǐng)域的創(chuàng)造力,那么智能交通就是AI技術(shù)深刻變革傳統(tǒng)行業(yè)的代表?!吨悄芙煌ā愤@本書中,李彥宏從關(guān)注自動駕駛解決安全問題開始,一點一點深入,也一點一點放大關(guān)注的尺度——關(guān)注人類司機(jī)危險駕駛的問題以及自動駕駛、智能交通、智慧城市等問題。
比如,將交通事故率降低90%;根據(jù)國際公路安全協(xié)會發(fā)布的數(shù)據(jù),每年約有135萬人死于交通事故,降低90%就可以減少百萬人死亡。再如,助力國家“3060”雙碳目標(biāo)達(dá)成,交通是非常重要的一環(huán)。建設(shè)未來的智慧城市,智能交通也是重要組成部分。李彥宏認(rèn)為,智能交通系統(tǒng)可以提高通行效率,節(jié)約能源,降低空氣污染的水平,幫助碳達(dá)峰和碳中和,惠及每一個有出行需求的人。
如果說這是《智能交通》一書創(chuàng)作的初衷,那么其中探討的內(nèi)容,更是全景式展現(xiàn)了人工智能技術(shù)的價值。聰明的車、智慧的路,構(gòu)筑完整的車路協(xié)同系統(tǒng),李彥宏判斷,智能交通將是影響未來10-40年的重大變革,10年之內(nèi),依托交通效率提升,城市擁堵問題將基本解決。
C114留意到,《智能交通》出版上市,受到了眾多知名人士和知名媒體的好評。例如中國工程院院士、國家新一代人工智能戰(zhàn)略咨詢委員會主任潘云鶴作序表示,“智能交通是一個兼具深度和廣度的智能大系統(tǒng),書中相關(guān)創(chuàng)新研究和實踐,一定能推動和引領(lǐng)國內(nèi)外智能交通的新發(fā)展。”
用AI技術(shù)基于本書創(chuàng)作的有聲書,值得一聽。對行業(yè)人士來說,堪稱“雙倍智能”的體驗。
Part3:顛覆AIGC,顛覆智能交通
百度在AI領(lǐng)域擁有宏偉的布局,僅從這套AI有聲書,就可以窺見其在兩個垂直領(lǐng)域的雄心:顛覆AIGC、顛覆智能交通。
從AIGC來看,當(dāng)前市面流行的內(nèi)容,無論是從制作方式還是內(nèi)容本身都較為粗淺,僅僅是人工制作內(nèi)容的補充,遠(yuǎn)遠(yuǎn)稱不上主流。AI有聲書《智能交通》由于內(nèi)容的專業(yè)性,很難成為爆款產(chǎn)品,但其采用AI技術(shù)制作的精英級水準(zhǔn),顯示出AIGC產(chǎn)業(yè)具有巨大潛力和可兌現(xiàn)能力,百度將扮演重要角色。
智能交通領(lǐng)域更加能夠全方位考驗一家人工智能公司的全棧式能力、深度學(xué)習(xí)水平、行業(yè)解決方案的價值與綜合社會效益。百度作為一家人工智能公司,在智能交通領(lǐng)域起步早、投資大、態(tài)度堅決,早已處于領(lǐng)軍者地位。
一方面,百度是全球領(lǐng)先的自動駕駛技術(shù)開發(fā)商,不僅推出自動駕駛開放平臺Apollo,還推出了自動駕駛出行服務(wù)平臺蘿卜快跑;另一方面,百度深入?yún)⑴c到全國智能交通的建設(shè)中,支持多個國家級車聯(lián)網(wǎng)先導(dǎo)區(qū)和各省市先導(dǎo)區(qū)的高質(zhì)量發(fā)展,從自動駕駛,走向自動駕駛和車路協(xié)同的全面發(fā)展。
百度在智能交通領(lǐng)域的深度實踐,正推動人工智能技術(shù)的產(chǎn)業(yè)化進(jìn)行一次高級別的、高價值的、高技術(shù)含量的驗證。而在AIGC領(lǐng)域的小試牛刀,也為行業(yè)注入了一股技術(shù)創(chuàng)新力,將攪動這一池春水,等待著內(nèi)容創(chuàng)作者的熱情回應(yīng)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 涉嫌違反限制性規(guī)定轉(zhuǎn)讓股票等行為 新易盛實控人、董事長高光榮被立案調(diào)查
- 天音移動:將100個虛商號段交還中國聯(lián)通
- 長沙電信員工反映加班嚴(yán)重 公司回應(yīng):避免無謂加班
- 中國移動11月5G網(wǎng)絡(luò)客戶凈增143萬戶,累計達(dá)5.47億戶
- 5G-A無源物聯(lián):夯實數(shù)字化底座,助力萬物智聯(lián)發(fā)展
- Wi-Fi7:6GHzWi-Fi如何支持醫(yī)療保健新時代
- 未來最值得關(guān)注的人工智能和機(jī)器學(xué)習(xí)趨勢是什么?
- 物聯(lián)網(wǎng)實現(xiàn)智能農(nóng)業(yè)的五大方式
- 人工智能在網(wǎng)絡(luò)安全中的作用
- 光迅科技:自研光芯片沒有直接對外銷售,主要滿足自用需求
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。