聲智科技遠(yuǎn)場(chǎng)聲紋和通話技術(shù)助力華為音箱聲而不同

2018年10月26日,華為Mate 20系列國(guó)內(nèi)發(fā)布會(huì)在上海舉辦,華為智能音箱正式解鎖上市。這款音箱,搭載了聲智科技最新的遠(yuǎn)場(chǎng)語(yǔ)音智能交互引擎,六麥環(huán)形麥克風(fēng)陣列的軟硬件一體化的解決方案,支持遠(yuǎn)場(chǎng)實(shí)時(shí)通話與聲紋識(shí)別功能,注定“聲”而不同,釋放不凡。

聲智科技遠(yuǎn)場(chǎng)聲紋和通話技術(shù)助力華為音箱聲而不同

聽(tīng)“聲”識(shí)人

華為智能音箱采用了聲智科技推出的全新的遠(yuǎn)場(chǎng)聲紋識(shí)別技術(shù),不再受限距離于聲紋識(shí)別的束縛,能夠根據(jù)用戶的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別出不同的使用者。支持識(shí)別8位“主人”的遠(yuǎn)場(chǎng)聲紋,通過(guò)遠(yuǎn)場(chǎng)聲紋來(lái)解鎖音箱。不僅貼合用戶自然的語(yǔ)音交互習(xí)慣,保證用戶使用的安全性和私密性,還可以根據(jù)用戶不同的喜好進(jìn)行內(nèi)容設(shè)定和服務(wù)推薦,實(shí)現(xiàn)更自由的“千人千面”的個(gè)性化體驗(yàn)。

聲智科技遠(yuǎn)場(chǎng)聲紋和通話技術(shù)助力華為音箱聲而不同

聲紋是一種行為特征,就像人類固有的其他生理特性,比如指紋、虹膜、人臉,是獨(dú)一無(wú)二的。每個(gè)人的語(yǔ)音波形參數(shù)反映的是相應(yīng)的生理和行為特征,對(duì)語(yǔ)音參數(shù)進(jìn)行特征提取和模型匹配,即可判斷出說(shuō)話人的身份。而且,聲紋不易纂改,綜合利用聲音中蘊(yùn)含的豐富信息,具備較高的安全特性。

然而,聲紋識(shí)別的唯一性雖然很好,但實(shí)際上人的聲音具有易變性,易受身體狀況、年齡、情緒,噪聲等的影響。特別是噪聲,在環(huán)境噪音較大和混合說(shuō)話人的環(huán)境下,聲紋特征很難提取和建模。為了適應(yīng)遠(yuǎn)場(chǎng)語(yǔ)音交互方式,改善噪聲環(huán)境下的聲紋識(shí)別率,聲智科技的遠(yuǎn)場(chǎng)聲紋識(shí)別技術(shù),對(duì)I-vertor方法進(jìn)行優(yōu)化的同時(shí)引入其他的特征,大幅提升了聲紋識(shí)別的準(zhǔn)確率。

語(yǔ)“音”撥號(hào)

華為智能音箱有一個(gè)非常炫酷的技能,用戶可以通過(guò)語(yǔ)音指令給家人和朋友撥打電話。這項(xiàng)新功能上線后,用戶無(wú)需時(shí)時(shí)刻刻帶著智能手機(jī),無(wú)論在家中,還是辦公室里,一句簡(jiǎn)單的語(yǔ)音指令,就可以通過(guò)音箱和家人朋友自由通話。試想一下,即使在廚房做飯,也可以通過(guò)智能音箱與朋友,一邊通話,一邊煲湯,無(wú)需束縛雙手,也無(wú)需局限于距離。這將改變大家的通訊方式。

聲智科技遠(yuǎn)場(chǎng)聲紋和通話技術(shù)助力華為音箱聲而不同

作為國(guó)內(nèi)首款支持VOIP通話功能的智能音箱,它要適應(yīng)更加復(fù)雜場(chǎng)景的語(yǔ)音交互,這種場(chǎng)景聲源往往距離麥克風(fēng)較遠(yuǎn),且存在較大的噪聲干擾,需要很強(qiáng)大的信號(hào)拾音能力,此外,聲音在網(wǎng)絡(luò)傳輸過(guò)程中會(huì)產(chǎn)生語(yǔ)音丟幀、語(yǔ)音編解碼的高頻損失,并受到全雙工通話的回聲、噪聲及猝發(fā)聲的干擾等問(wèn)題。為了解決這些問(wèn)題,保證華為智能音箱在遠(yuǎn)場(chǎng)語(yǔ)音實(shí)時(shí)通話的場(chǎng)景下仍然有出色的實(shí)時(shí)語(yǔ)音通話效果,聲智科技為華為音箱提供了針對(duì)VOIP獨(dú)家定制的遠(yuǎn)場(chǎng)雙工通話解決方案,運(yùn)用麥克風(fēng)陣列、音頻編解碼、丟包補(bǔ)償和語(yǔ)音重建、網(wǎng)絡(luò)抖動(dòng)緩沖等技術(shù),確保流暢的通話體驗(yàn)。

“聲”隨心動(dòng)

無(wú)論是華為音箱的聲紋識(shí)別還是VOIP語(yǔ)音通話功能,都離不開(kāi)最根本的前端聲學(xué)解決方案。基于聲智科技自主知識(shí)產(chǎn)權(quán)的6麥環(huán)形陣列,華為智能音箱可實(shí)現(xiàn)360度全方向拾音,滿足用戶在真實(shí)環(huán)境中3-5米無(wú)死角遠(yuǎn)場(chǎng)語(yǔ)音交互的需求。搭載聲智科技全鏈條智能遠(yuǎn)場(chǎng)語(yǔ)音交互系統(tǒng)SoundAI Voice Kit(SVK),集成聲波配網(wǎng)、波束形成、聲源測(cè)向、噪聲抑制、混響消除、回聲消除、語(yǔ)音喚醒、端點(diǎn)檢測(cè)、語(yǔ)音識(shí)別、聲紋識(shí)別、語(yǔ)義理解、語(yǔ)音合成、雙工通話、自然語(yǔ)言處理等核心算法,確保5米內(nèi)的嘈雜環(huán)境中的精準(zhǔn)語(yǔ)音喚醒與識(shí)別,讓用戶無(wú)懼環(huán)境,想說(shuō)就說(shuō),聲隨心動(dòng)。

未來(lái),語(yǔ)音交互作為用戶獲取智能內(nèi)容與服務(wù)的入口以及智能設(shè)備的中控,需要集成更多元的功能,解鎖更豐富的應(yīng)用場(chǎng)景,只有軟硬件一體化融合聲學(xué)前沿技術(shù)和智能語(yǔ)言服務(wù)的全鏈條解決方案才是通向智能語(yǔ)音交互時(shí)代的正解。

關(guān)于聲智科技

聲智科技是全球領(lǐng)先的聲學(xué)語(yǔ)音技術(shù)和語(yǔ)言智能服務(wù)科技創(chuàng)新公司,專注于聲學(xué)前沿技術(shù)和人工智能交互,秉持“聽(tīng)你所言,知你所想”的技術(shù)理念,致力于通過(guò)不斷引領(lǐng)真實(shí)環(huán)境下的人機(jī)交互體驗(yàn),實(shí)現(xiàn)“聲音連接智能未來(lái)”的使命,“更自由的人機(jī)互聯(lián)”愿景。

聲智科技主要提供融合遠(yuǎn)場(chǎng)語(yǔ)音交互和遠(yuǎn)場(chǎng)實(shí)時(shí)通話技術(shù)的SoundAI Voice Kit(SVK)語(yǔ)音交互系統(tǒng),從端到云的智能語(yǔ)音交互技術(shù)和服務(wù)方案,以及芯片、模組、開(kāi)發(fā)板到完整產(chǎn)品的智能語(yǔ)音應(yīng)用方案。目前與百度、阿里、騰訊、ARM、NVIDIA、Xilinx、Cypress、Bosch、Cadence等著名企業(yè)深度合作,深耕智能家居、智能汽車、智能安防、智能金融、智能教育、智能醫(yī)療和機(jī)器人等行業(yè),服務(wù)小米、百度、阿里、華為、騰訊、聯(lián)想、創(chuàng)維、金蝶、浪潮、中國(guó)移動(dòng)、奇虎360、中央人民廣播電臺(tái)等客戶,是國(guó)內(nèi)服務(wù)用戶最多、應(yīng)用場(chǎng)景最全和覆蓋地域最廣的遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)供應(yīng)商。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-10-26
聲智科技遠(yuǎn)場(chǎng)聲紋和通話技術(shù)助力華為音箱聲而不同
2018年10月26日,華為Mate 20系列國(guó)內(nèi)發(fā)布會(huì)在上海舉辦,華為智能音箱正式解鎖上市。

長(zhǎng)按掃碼 閱讀全文