百度語音技術(shù)獲重大突破開發(fā)者將享受先進成果

最近,在語音技術(shù)領(lǐng)域,最熱的話題莫過于百度在漢語語音識別技術(shù)方面獲得的重大突破——該技術(shù)能夠做到在安靜環(huán)境下,漢語普通話語音識別的準確率接近97%。于是,一些創(chuàng)業(yè)的朋友來問,開發(fā)者能不能使用這項基于新技術(shù)的語音識別能力?

經(jīng)過多番詢問,得到的答案是肯定的。

實際上,百度語音識別能力早已在百度開發(fā)者中心(http://developer.baidu.com/)對外開放。為了推廣語音技術(shù)的產(chǎn)業(yè)化應(yīng)用,百度還于近期舉辦了“百度開發(fā)者創(chuàng)新大賽——智能語音2015”(大賽官網(wǎng)http://developer.baidu.com/event_entry/voicedev2015),提供豐厚獎品、免費APP推廣資源等,鼓勵開發(fā)者調(diào)用百度免費開放的語音識別能力,開發(fā)出創(chuàng)新的移動應(yīng)用。

而不久之后,基于此次重大技術(shù)突破、擁有更精準識別率的語音識別能力,也將登錄百度開發(fā)者中心。

那么,這次技術(shù)突破到底有多牛?能給開發(fā)者帶來什么?

“百度研發(fā)出了基于多層單向LSTM的漢語聲韻母整體建模技術(shù),并成功把連接時序分類(CTC)訓(xùn)練技術(shù)嵌入到傳統(tǒng)的語音識別建??蚣苤?,再結(jié)合語音識別領(lǐng)域的決策樹聚類、跨詞解碼和區(qū)分度訓(xùn)練等技術(shù),大幅度提升線上語音識別產(chǎn)品性能。”

這是百度語音技術(shù)部負責(zé)人賈磊的介紹,聽上去是不是只有一個感覺——不明覺厲?反正技術(shù)君有這樣的感覺。

于是,技術(shù)君經(jīng)過艱苦努力,用一句更“人類”的語言來解釋這個技術(shù),那就是:這技術(shù)牛,非常牛!它成功攻克了語音識別領(lǐng)域十多年的一個技術(shù)困局,使 漢語語音識別相對錯誤率再次大幅下降15%以上;基于這一技術(shù),在安靜環(huán)境下,漢語普通話語音識別的準確率接近97%。因為這一重大突破,賈磊還受邀在全 國人機語音通訊學(xué)術(shù)會議(NCMMSC2015,注:NCMMSC是中國人機語音領(lǐng)域最權(quán)威的學(xué)術(shù)會議)上發(fā)表演講。

更簡潔來講,我們看到的好處就是:

1. 語音識別準確率提升。

2. 語音識別速度提升。

3. 語音服務(wù)提供者的投入成本降低。

4. 語音技術(shù)領(lǐng)域研究人員可參考百度技術(shù)模型,改善自己的研究,從而在語音領(lǐng)域獲得更大突破。

還是不明白?想象一個場景:

你在大街上一邊走,一邊想查找附近的百貨大樓怎么走,于是,你打開地圖APP,點開語音按鈕,說著“百貨大樓”。1秒、2秒、3秒……終于,APP返回了結(jié)果——“白佛大羅”??吹竭@些字,你的內(nèi)心此時是不是很崩潰?

當然,上面這個場景描述地夸張了點,現(xiàn)在的語音識別技術(shù)已經(jīng)能比較準、比較快地識別出來了。而百度研發(fā)的這個新技術(shù),能夠比現(xiàn)有識別能力識別地更準、更快,而且能降低噪音、口音、說話距離遠近等因素對識別率造成的不良影響。

作為開發(fā)者,這個能力帶來的效果是顯著的。在調(diào)用百度的這一能力后,能讓APP的語音識別服務(wù)更精準、更快速,從而提升整體用戶體驗。你是不是也想試一試了呢?

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2015-11-05
百度語音技術(shù)獲重大突破開發(fā)者將享受先進成果
最近,在語音技術(shù)領(lǐng)域,最熱的話題莫過于百度在漢語語音識別技術(shù)方面獲得的重大突破——該技術(shù)能夠做到在安靜環(huán)境下,漢語普通話語音識別的準確率接近97%。于是,一些創(chuàng)業(yè)的朋友來問,開發(fā)者能不能使用這項基于新技術(shù)的語音識別能力?

長按掃碼 閱讀全文