對標(biāo)GPT-4o,訊飛星火版Her來了,推出極速超擬人交互

中國版GPT-4o來了!沒等來OpenAI的“Her”,訊飛星火版“Her”搶先到來,打造國內(nèi)首個全新中文交互模式,并將在8月底率先全民開放使用。這意味著國內(nèi)首個對標(biāo)GPT-4o語音功能的產(chǎn)品正式到來。

8月19日,科大訊飛宣布星火語音大模型更新,正式推出星火極速超擬人交互,并將其能力落地在訊飛星火APP“小星暢聊”功能中。星火極速超擬人交互響應(yīng)速度更快,對話更加自然流暢,隨時打斷、插話之后還能秒回。有趣的是,星火極速超擬人交互還能感知你的情緒變化,并共情地回應(yīng)你的喜怒哀樂,在表達(dá)上更加自然、更具情感。

從官方展示效果來看,星火極速超擬人交互在響應(yīng)和打斷速度、情緒感知情感共鳴、語音可控表達(dá)、人設(shè)扮演四個方面實現(xiàn)突破,讓整體的交互體驗更自然、更有趣,就像電影《Her》中展現(xiàn)的智能且人性化的聊天效果一樣。

在響應(yīng)速度上,星火極速超擬人交互支持極速響應(yīng)多輪交互,能夠在對話過程中生成高質(zhì)量的回答,并且響應(yīng)速度更快、與GPT-4o響應(yīng)時間相當(dāng),幾乎與人類正常聊天節(jié)奏一致,并且對話中允許用戶隨時打斷、插話,可謂實現(xiàn)了人機(jī)對話的“無縫銜接”。

在情緒感知情感共鳴上,星火極速超擬人交互可以在對話中感知到用戶的喜、怒、哀、樂、害怕、困惑等各類情緒,不僅能根據(jù)聲音的內(nèi)容來判斷,還能像朋友一樣用合適的情感回應(yīng)用戶。比如,用笑聲回應(yīng)開心,安慰悲傷情緒……此刻是不是有一種《Her》的既視感。同時,星火極速超擬人交互還能識別用戶咳嗽、貓和狗的叫聲等,給出對應(yīng)的回復(fù)語。

相比以前語音交互中機(jī)器聲音無法調(diào)整的情況,現(xiàn)在只要語音發(fā)出指令,就可以控制超擬人在情感、風(fēng)格、方言、強(qiáng)度等表達(dá)方式上做出變化?!坝谜{(diào)侃的方式給我說個笑話”、“用東北話給外地朋友介紹下鍋包肉”、“說的更快一點(diǎn)”……

此外,星火極速超擬人交互還支持“角色扮演”,可以模仿不同的角色陪你聊天。比如,“模仿孫悟空的聲音來和小孩子對話”,超擬人便會模仿孫悟空的聲音和人設(shè)和小朋友聊天。

今年5月OpenAI驚艷亮相了GPT-4o,展示了堪比電影《Her》中的人機(jī)交互體驗,但遲遲沒有面向用戶開放,上個月底也只是選擇性地向一小部分Alpha測試參與者開放部分語音功能。

訊飛星火版Her的到來,可以說比OpenAI搶先一步落地,也代表國產(chǎn)大模型開始從追趕、對標(biāo)到進(jìn)行自主創(chuàng)新、走出差異化路線。

據(jù)科大訊飛透露,此次星火極速超擬人交互采用統(tǒng)一神經(jīng)網(wǎng)絡(luò)直接實現(xiàn)語音到語音端到端建模,對比傳統(tǒng)的語音轉(zhuǎn)文字、大模型生成回復(fù)文本、語音合成三步驟來說可謂“一氣呵成”,大幅縮短響應(yīng)時間的同時,也提升了交互擬人度和流暢度。

同時,結(jié)合訊飛多維度的語音屬性解耦表征訓(xùn)練準(zhǔn)則,將內(nèi)容、音色、情感、語言、風(fēng)格都信息進(jìn)行解耦訓(xùn)練,使得星火極速超擬人交互能夠更加靈活控制各類元素,還能根據(jù)需求便捷定制,讓系統(tǒng)快速落地應(yīng)用。

正是基于以上技術(shù)創(chuàng)新,8月底星火極速超擬人交互將率先全民開放使用??拼笥嶏w表示,基于全新端到端框架創(chuàng)新基礎(chǔ)上,星火極速超擬人交互目前主要開放語音模態(tài),未來會持續(xù)在交互上創(chuàng)新突破,不僅會帶來更多更實用、豐富的功能,也會拓展到更多模態(tài)。

在2023年科大訊飛全球1024開發(fā)者節(jié)上,華為科技有限公司副董事長、輪值董事長徐直軍曾表示,“華為公司在全球所有使用的智能終端的語音技術(shù),都是來自于科大訊飛,而且不僅僅是中文”。這一波語音能力的革新,多輪交互、語義理解、指令跟隨、邏輯推理、情感共鳴……代表了智能語音交互領(lǐng)域的一大階躍。全新的星火超擬人交互模式達(dá)到了類人級別的極速響應(yīng)和聰明、實用、流暢、自然的非凡表現(xiàn),這一技術(shù)的應(yīng)用和普及還隱藏著巨大的可能性——語音市場在這個時代將被重寫,語音交互帶動萬物互聯(lián)的第六次產(chǎn)業(yè)浪潮有望出現(xiàn)一次井噴。

該項技術(shù)突破,將會極大地促進(jìn)智能語音技術(shù)進(jìn)一步應(yīng)用于智能手機(jī)、智能汽車、智能家電以及智能家居等各類消費(fèi)級產(chǎn)品當(dāng)中,并且隨著全球化進(jìn)程的加深,對多語種、多方言的需求也會持續(xù)增加。據(jù)國際數(shù)據(jù)公司IDC分析,預(yù)計到2030年,全球智能語音服務(wù)市場規(guī)模將達(dá)約731.6 億美元,復(fù)合增長率27%。科大訊飛憑借上述技術(shù)突破有望收獲新一輪產(chǎn)業(yè)紅利。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-08-19
對標(biāo)GPT-4o,訊飛星火版Her來了,推出極速超擬人交互
對標(biāo)GPT-4o,訊飛星火版Her來了,推出極速超擬人交互

長按掃碼 閱讀全文