星火語音大模型發(fā)布,將推動人機交互革命

“大模型帶來了語音技術(shù)發(fā)展的全新機會。”

1月30日,科大訊飛發(fā)布新升級的訊飛認知大模型星火V3.5,并正式發(fā)布星火語音大模型,推動萬物互聯(lián)時代下人機交互場景變革。

“科大訊飛從創(chuàng)業(yè)之初的夢想和使命,就是要實現(xiàn)溝通無障礙。25年了,我們目標和夢想一天都沒有變。”科大訊飛董事長劉慶峰在發(fā)布會現(xiàn)場如是說。星火語音大模型所展現(xiàn)出的卓越性能,驗證了科大訊飛在人工智能自然語音領(lǐng)域的深厚積累,也彰顯了其在推動人機交互技術(shù)進步方面的能力與決心。

三大維度能力升級,星火語音大模型效果國際領(lǐng)先

科大訊飛的智能語音技術(shù)持續(xù)走在世界前列,2023年以來,在DCASE工業(yè)聲紋挑戰(zhàn)賽、IWSLT國際機器口語翻譯大賽、CHiME高噪音復(fù)雜多通道多人說話場景比賽、國際車載多通道語音識別挑戰(zhàn)賽等涉及工業(yè)、高噪、車載等復(fù)雜場景的比賽中接連收獲冠軍。

與此同時,全球?qū)φZ音大模型的研究開始快速升溫,出現(xiàn)了新的顛覆性技術(shù)邏輯?;诤A康臄?shù)據(jù)訓(xùn)練,大模型可以實現(xiàn)更精細的模型描述、更精準的語義理解以及更統(tǒng)一的多任務(wù)建模,這給語音技術(shù)的發(fā)展帶來了全新機會。憑借星火認知大模型的持續(xù)升級,以及科大訊飛在語音屬性解耦表征預(yù)訓(xùn)練等方面的深厚積累,基于“飛星一號”的國產(chǎn)算力平臺,科大訊飛在幾個月內(nèi)迅速推出了訊飛星火語音大模型。

目前,星火語音大模型在語音合成層面提升了韻律表現(xiàn)力和擬人度,在語音識別領(lǐng)域突破復(fù)雜場景識別效果上限,在多語種層面提升語料稀缺小語種效果。“通過星火語音大模型的評測效果,我們非常自豪地告訴大家,科大訊飛繼續(xù)保持了全球領(lǐng)先的水平。”劉慶峰介紹,星火語音大模型效果國際領(lǐng)先,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3,在多語種語音合成方面,星火語音大模型的首批40個語種擬人度超83%。

四大功能特性,重塑人機交互體驗

在星火語音大模型的加持下,智能客服實現(xiàn)進一步升級,具備超擬人語音合成、情緒感知、復(fù)雜語義理解、業(yè)務(wù)邏輯推理四大功能特性,將重塑人機交互體驗。

超擬人合成技術(shù)可以通過更精細的模型描述,提升智能客服的韻律表現(xiàn)力和擬人度,生成更像人、更生動的語音表達,實現(xiàn)近乎完美的人機交互體驗,為客服機器人的應(yīng)用開辟了新的可能。

情緒感知能力使智能客服能夠更好地理解和回應(yīng)用戶的情感狀態(tài)。通過分析用戶的語音語調(diào)、語速和表達方式等特征,智能客服可以判斷用戶的情緒是積極的、消極的還是中性的,調(diào)整自己的回答方式,以提供更加貼心的服務(wù)。

復(fù)雜語義理解能力讓智能客服可以在較長的對話中,理解上下文的變化,對用戶的需求提供更準確的反饋,并能通過提問的方式引導(dǎo)用戶提供更多信息,從而解決復(fù)雜問題,提高用戶滿意度。語音打斷功能允許用戶隨時中斷智能客服的發(fā)言,這種靈活性使得用戶能夠更好地控制對話的進程,實現(xiàn)更加高效的交互。

業(yè)務(wù)邏輯推理能力使智能客服在接入客戶問詢時,能夠理解用戶意向及偏好,識別銷售機會,引導(dǎo)相關(guān)產(chǎn)品或服務(wù),以提供更為精準和個性化的體驗,這一能力對于增強用戶體驗和提升服務(wù)效率具有顯著意義,也可幫助企業(yè)在服務(wù)過程中實現(xiàn)潛在的業(yè)務(wù)轉(zhuǎn)化。

“百”搭型選手,賦能實際行業(yè)應(yīng)用

客服是人機交互的典型場景之一,也是各行各業(yè)的剛需場景。作為“百搭”型產(chǎn)品,星火智能客服在行業(yè)中的應(yīng)用已經(jīng)非常廣泛。

以金融客戶服務(wù)為例,當(dāng)用戶來電咨詢關(guān)于理財產(chǎn)品或信用卡額度等相關(guān)問題時,智能客服能夠迅速識別用戶的多樣化需求,并將這些需求與相應(yīng)的業(yè)務(wù)模塊相匹配,提供準確的解答。同時,在回答問題的過程中,智能客服還會運用專業(yè)的引導(dǎo)話術(shù),如在收到用戶咨詢信用卡額度相關(guān)問題時,關(guān)聯(lián)信用卡提額相關(guān)活動,引導(dǎo)用戶完成業(yè)務(wù)辦理,從而在一輪通話內(nèi)完成從閑聊咨詢到業(yè)務(wù)營銷到業(yè)務(wù)辦理的全過程。

星火語音大模型的應(yīng)用遠不止于客服領(lǐng)域,其廣泛的適用性使其能夠在各行各業(yè)發(fā)揮重要作用。例如,在汽車行業(yè),星火語音大模型的集成將極大提升智能駕駛艙、智能座艙、智能導(dǎo)航系統(tǒng)以及音樂控制系統(tǒng)的交互體驗,使之更加精準、高效。此外,陪伴機器人、導(dǎo)購機器人、輔助診斷機器人、智能家居設(shè)備以及穿戴式技術(shù)產(chǎn)品等領(lǐng)域,也將因星火語音大模型的加持而迎來新的發(fā)展機遇,進一步激發(fā)產(chǎn)業(yè)活力。

雙重價值提升:用戶體驗與企業(yè)效率

技術(shù)價值的核心在于應(yīng)用,而應(yīng)用的成效需要看實際落地效果。目前,星火智能客服產(chǎn)品已經(jīng)在科大訊飛內(nèi)部上線使用,其應(yīng)用價值不僅體現(xiàn)在提升用戶體驗,更在于幫助企業(yè)降本增效。

首先,星火智能客服較之傳統(tǒng)智能客服,在復(fù)雜說法理解、擬人化交互層面具有較大優(yōu)勢,加之目前知識管理已實現(xiàn)文檔級運營,能夠?qū)崿F(xiàn)24小時不間斷的客戶服務(wù),端到端解決用戶問題,提升用戶體驗。科大訊飛400客服中心,率先使用大模型文字客服,機器人自助服務(wù)率環(huán)比提升142%, 通過大模型賦能坐席,話后處理時長環(huán)比降低30%。

此外,星火智能客服能夠自動學(xué)習(xí)知識庫中的知識,處理大量重復(fù)性和常規(guī)性的咨詢,話后可以自動生成工單小結(jié),將坐席人員從繁重冗余的工作中解放出來,從事更為復(fù)雜和創(chuàng)造性的工作。這樣的智能化分工,有助于降低企業(yè)的人力成本,同時提高整體的工作效率。再深一層,星火智能客服還能夠從海量通話中提取共性需求,幫助企業(yè)更好地理解用戶,優(yōu)化產(chǎn)品和服務(wù),在激烈的市場競爭中獲得優(yōu)勢。

在智能語音領(lǐng)域,科大訊飛始終保持著行業(yè)領(lǐng)跑者的姿態(tài)。“如今,通過大模型的應(yīng)用,科大訊飛能夠賦予語音更多維度的特性,包括語種識別、內(nèi)容理解、韻律把握、音色變化以及情緒表達等。”可以預(yù)見,2024年,由訊飛星火所引領(lǐng)的新一代人機交互模式,將全面開啟未來交互新紀元。

*文中數(shù)據(jù)來源于實際應(yīng)用

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )