數(shù)據(jù)堂智能語音數(shù)據(jù)庫,讓客服更智能

撥打海底撈餐廳的客服電話,一個語氣熱情的女聲從電話那頭傳來,很多人可能都沒有意識到,這并不是人工客服,而是智能電話機器人的聲音。

同樣,當(dāng)你撥打10086/10010客服熱線,電話那頭不再是話務(wù)員,而是智能機器人客服在接聽。所有這些變化都得益于智能客服的普及。

在客服語音識別技術(shù)的支持下,智能客服為企業(yè)與海量用戶之間的溝通建立了一種基于自然語言的快捷有效的技術(shù)手段,能夠降低客服中心的人力成本、提升客服中心的運營效率。

不過,隨著智能客服在各個行業(yè)的普及,越來越多人反映智能客服有時并不“智能”。

當(dāng)你撥打銀行客服電話時,經(jīng)常會聽到“請直接說出你要辦理的業(yè)務(wù)”的提示,但“答非所問”的現(xiàn)象十分常見。一位市民曾表示,與智能客服的交流“還是和機器交流的感覺,而且你說話一定要短,不然也得重來一遍”。

造成智能客服“兜圈子”、“聽不懂人話”的一個重要原因在于語音語言的復(fù)雜性。

首先,中國有七大方言區(qū)、數(shù)十種方言,不同的地域有不同的口音特點。所以,如何識別客戶的方言以及帶有口音的普通話,成為客服語音識別亟待解決的問題。

其次,人們習(xí)慣于以非常自然的方式同客服進行對話,語速快、吐字不清、搶話疊字等說話習(xí)慣同樣會對客服語音識別的準(zhǔn)確率產(chǎn)生影響。

最后,電話信道數(shù)字語音的采樣頻率定義為8kH,音質(zhì)較差,且各行各業(yè)都擁有自己獨特的領(lǐng)域術(shù)語,客觀上也為客服語音識別構(gòu)成了挑戰(zhàn)。

數(shù)據(jù)堂在深刻理解智能客服場景的基礎(chǔ)上,對海量原始語音數(shù)據(jù)進行提取、分類、標(biāo)注等一系列處理,將混雜的數(shù)據(jù)轉(zhuǎn)化為可供機器深度學(xué)習(xí)的智能客服專業(yè)數(shù)據(jù),為上述客服語音識別面臨的技術(shù)挑戰(zhàn)提供了可靠的數(shù)據(jù)解決方案。

普通話語音識別

構(gòu)建普通話基礎(chǔ)語音數(shù)據(jù),能夠有效提升智能客服系統(tǒng)對普通話識別的精準(zhǔn)度。

數(shù)據(jù)堂開發(fā)的普通話基礎(chǔ)語音數(shù)據(jù)包括普通話朗讀數(shù)據(jù)、重口音普通話數(shù)據(jù)和普通話自然對話數(shù)據(jù)。

朗讀數(shù)據(jù)能夠為客服語音識別提供模型,重口音普通話數(shù)據(jù)能夠提高各地口音語音的適應(yīng)性,而自然對話數(shù)據(jù)能夠提高自然風(fēng)格語音的適應(yīng)性。

數(shù)據(jù)堂自有版權(quán)普通話語音數(shù)據(jù)

數(shù)據(jù)堂智能語音數(shù)據(jù)庫,讓客服更智能

方言語音識別

與普通話語音識別的解決方案類似,基礎(chǔ)語音數(shù)據(jù)也是提升方言語音識別精準(zhǔn)度的重要保障。

數(shù)據(jù)堂開發(fā)的方言語音基礎(chǔ)數(shù)據(jù)包括方言朗讀數(shù)據(jù)和方言自然對話數(shù)據(jù)。

方言朗讀數(shù)據(jù)是構(gòu)建方言語音識別模型的基礎(chǔ),方言自然對話數(shù)據(jù)能夠提高自然風(fēng)格語音的適應(yīng)性。

數(shù)據(jù)堂自有版權(quán)方言語音數(shù)據(jù)

數(shù)據(jù)堂智能語音數(shù)據(jù)庫,讓客服更智能

數(shù)據(jù)定制服務(wù)

為了有效解決客服語音識別所面臨的領(lǐng)域術(shù)語難題,數(shù)據(jù)堂特提供數(shù)據(jù)定制服務(wù)。

數(shù)據(jù)堂智能語音數(shù)據(jù)庫,讓客服更智能

客服語音標(biāo)注示例

數(shù)據(jù)堂積累了近十年標(biāo)注經(jīng)驗,打造了一個業(yè)內(nèi)領(lǐng)先的數(shù)據(jù)處理平臺。

數(shù)據(jù)堂創(chuàng)建了可視化數(shù)據(jù)制作流程和管理制度,擁有語音、文本、圖片和視頻等近20種豐富的可配置工具,掌握多個領(lǐng)域20余個場景的預(yù)處理能力,保障了自動標(biāo)注的高效性。

為保障數(shù)據(jù)的質(zhì)量,數(shù)據(jù)堂采取了標(biāo)注(多人擬合)、質(zhì)檢(機器質(zhì)檢、人工抽檢)、人工驗收等多級數(shù)據(jù)質(zhì)量管控措施。

數(shù)據(jù)堂智能語音數(shù)據(jù)庫,讓客服更智能

數(shù)據(jù)堂保密性極高的標(biāo)注服務(wù)基地

數(shù)據(jù)堂提供的數(shù)據(jù)處理平臺私有化部署+云標(biāo)注的模式能夠有效保護客服數(shù)據(jù)所涉及的企業(yè)機密或客戶隱私。

數(shù)據(jù)堂的語音數(shù)據(jù)產(chǎn)品可以做到從智能客服實際應(yīng)用場景出發(fā),幫助客戶快速提升語音識別的性能。

數(shù)據(jù)堂在人工智能數(shù)據(jù)服務(wù)領(lǐng)域?qū)⒊掷m(xù)發(fā)揮導(dǎo)向性作用,不斷優(yōu)化自身業(yè)務(wù)與技術(shù)實力,為人工智能技術(shù)研發(fā)與應(yīng)用提供數(shù)據(jù)能源支持。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )