聲音定制三天交付,深聲科技如何在語音AI賽道彎道超車?

自2015年開始,中國人工智能市場規(guī)模逐年攀升,2018年中國人工智能市場規(guī)模約為238.2億元,增長率達(dá)到56.6%,據(jù)預(yù)測,到2020年,中國在人工智能的市場規(guī)模將接近500億元。

“語音是AI智能時代的重要入口,”深聲科技創(chuàng)始人周俊明說。他的底氣來自多年的行業(yè)積累和互聯(lián)網(wǎng)產(chǎn)品開發(fā)經(jīng)驗。

2012年,周俊明從中科院計算所博士畢業(yè),順利進入廣電行業(yè)龍頭企業(yè)北京永新視博擔(dān)任高級算法工程師,主要負(fù)責(zé)音視頻算法工作;2013年,他憑借音視頻算法技術(shù)能力,被騰訊選中,故任職于此,繼續(xù)從事在線音視頻算法技術(shù)研發(fā)工作;2016年,他加入了歡聚時代,擔(dān)任音視頻技術(shù)總負(fù)責(zé)人,帶領(lǐng)國內(nèi)頂級音視頻團隊,為YY提供核心技術(shù)服務(wù)和技術(shù)創(chuàng)新方案。

2018年,周俊明和核心團隊成員共同創(chuàng)辦了“深聲科技”,一家智能語音技術(shù)服務(wù)商,主要通過基于深度學(xué)習(xí)的文字轉(zhuǎn)語音整體解決方案服務(wù)B端客戶,提高客戶在行業(yè)內(nèi)的競爭壁壘,幫助客戶形成獨有的競爭優(yōu)勢。據(jù)悉,成立不到半年,深聲科技就獲得了來自小米科技的數(shù)千萬元天使輪融資。

AI行業(yè)從不缺競爭對手,BAT等頭部大企業(yè)有強者的打法,初創(chuàng)企業(yè)也有自己彎道超車的策略。深聲科技在多年的實踐摸索發(fā)現(xiàn),以往客戶在語音合成中最關(guān)心的是信息的傳遞。但隨著物質(zhì)生活的不斷提高,客戶對于語音轉(zhuǎn)化真實感的需求也日益劇增,催生了擬人聲智能營銷、擬人互動、擬人陪伴等大規(guī)模商業(yè)化應(yīng)用場景和價值?;诖诉壿?,深聲科技在商業(yè)模式方面主打三大場景:語音內(nèi)容輸出、智能語音交互、智能客服營銷。

其中,內(nèi)容輸出業(yè)務(wù)是深聲科技重點推進的主線業(yè)務(wù),團隊主要通過與有版權(quán)IP的企業(yè)合作,以有聲閱讀的方式將深聲語音呈現(xiàn)給消費者,內(nèi)容涵蓋文學(xué)、動漫、新聞資訊等多種題材和類型。根據(jù)深聲科技提供的數(shù)據(jù)顯示,深聲目前已與十余家行業(yè)頭部的內(nèi)容版權(quán)企業(yè)達(dá)成合作,一方面為企業(yè)提供文字語言轉(zhuǎn)化工具,按字?jǐn)?shù)收費;另一方面,提供語音合成整體解決方案,共同開發(fā)版權(quán)IP的語音形式。

語音交互業(yè)務(wù)中,團隊依托投資方小米的資源及產(chǎn)品,重點服務(wù)智能語音音箱和車聯(lián)網(wǎng)企業(yè),為其提供語音合成、數(shù)據(jù)制作和人機交互等服務(wù),協(xié)助客戶在產(chǎn)品開發(fā)過程中精準(zhǔn)感知用戶需求,增強行業(yè)競爭優(yōu)勢。

智能客服營銷業(yè)務(wù)是深聲科技正在嘗試的場景,深聲科技主要幫助運營商和金融客戶定制聲音并合成聲音,使其在營銷過程中提高通話時長和營銷轉(zhuǎn)化率。談及看好語音交互和智能客服營銷這兩類客戶群體的原因時,周俊明告訴創(chuàng)業(yè)邦,這兩類客戶對于語音音質(zhì)的要求更高,通過深聲科技自身語音合成技術(shù)的優(yōu)勢能很快產(chǎn)生規(guī)?;?yīng),且這兩類客戶群體的長期付費能力更強。

從時間的維度上看,深聲科技相比科大訊飛、商湯科技等AI企業(yè)入局較晚,但團隊正在加緊業(yè)務(wù)布局,構(gòu)建自身技術(shù)壁壘。首先,基于端到端的語音合成技術(shù)邏輯,深聲科技會對采集到的原始語音進行自動標(biāo)注,再由聲學(xué)模型算法對語言和語音進行音素級特征對齊,可以實現(xiàn)完全擬人發(fā)聲,將語氣、語調(diào)、語速、抑揚頓挫等語音特點完美呈現(xiàn)。在Blizzard Challenge 2019 國際語音合成大賽中,該技術(shù)在PER(拼音-不包含聲調(diào)-錯誤率)和PTER(拼音-包含聲調(diào)-錯誤率)兩個指標(biāo)上優(yōu)于科大訊飛。此外,團隊在聲音定制合成方面的交付能力突出,三天內(nèi)便可完成,而行業(yè)一般需要3~6個月。

成立不到兩年,團隊已有50多人規(guī)模,其中80%為技術(shù)研發(fā)人員。團隊主要成員擁有中科院、中山大學(xué)、華南理工、日本早稻田大學(xué)等名校碩博教育背景和騰訊、網(wǎng)易、YY等名企工作經(jīng)歷。聯(lián)合創(chuàng)始人黃博賢擁有12年的互聯(lián)網(wǎng)語音和音頻技術(shù)積累,先后在酷狗和YY主導(dǎo)語音和音頻技術(shù)的開發(fā)。

接下來,團隊會重點在效果、性能、數(shù)據(jù)三個維度優(yōu)化算法技術(shù),為各行各業(yè)提供更多標(biāo)準(zhǔn)化解決方案,加速技術(shù)落地,同時完善智能語音交互全鏈路技術(shù)。2020年,團隊還將推出面向C端用戶的語音克隆產(chǎn)品,在陪伴、親子互動、泛娛樂等交互場景全面發(fā)力。

目前,該項目已啟動A輪融資,資金將全部用于團隊建設(shè)及業(yè)務(wù)拓展。

本文相關(guān)的文章列表頁頭圖圖片來源于攝圖網(wǎng),經(jīng)授權(quán)使用。本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請聯(lián)系。

作者:王涵

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-01-13
聲音定制三天交付,深聲科技如何在語音AI賽道彎道超車?
自2015年開始,中國人工智能市場規(guī)模逐年攀升,2018年中國人工智能市場規(guī)模約為238.2億元,增長率達(dá)到56.6%,據(jù)預(yù)測,到2020年,中國在人工智能的市場規(guī)模將接近500億元。

長按掃碼 閱讀全文