百度牽頭成立的智能語音聯(lián)盟,或?qū)⒊蔀橹袊腁RM

語音技術(shù)作為人工智能的重點研究領(lǐng)域,不僅可以帶來全新的、變革式的人機(jī)交互方式,還有機(jī)會催生出人類和機(jī)器的情感交流。源于語音對人類的重要性,科技巨頭們再一次將目光投到了智能語音領(lǐng)域。

近日,由百度、海爾、京東、中興通訊、中國普天、北汽股份、京東方聯(lián)合發(fā)起,二十余家單位共同組成的智能語音知識產(chǎn)權(quán)產(chǎn)業(yè)聯(lián)盟正式成立。該聯(lián)盟通過組建專利池的方式,引導(dǎo)和促進(jìn)語音技術(shù)跨行業(yè)的實施和應(yīng)用,并對聯(lián)盟成員免費開放專利池專利。

理想主義者的分享

這是百度繼兩年前開放語音能力后,又一次“工程師式的理想主義”的實現(xiàn)?;谠谥悄苷Z音核心技術(shù)中的的長期積累,百度率先將首批滿足專利池標(biāo)準(zhǔn)的100多件語音技術(shù)專利放入專利池中開放許可給聯(lián)盟成員使用。

從開放語音能力,到開放技術(shù)專利,百度分享的初衷和盡頭永遠(yuǎn)都是希望科技能真正解決人們的問題讓生活更美好。在過去的兩年中,包括聯(lián)想智能電視、小米手機(jī)、信利智能可穿戴設(shè)備、特斯拉電動汽車等廠商以及去哪兒、陌陌等APP都使用了百度語音開發(fā)技術(shù)成果。這種免費開放的合作接入為企業(yè)提供了語音問題的解決方案,極大的縮短了開發(fā)周期,也在一定程度上減少了開發(fā)成本。除此之外,對許多創(chuàng)業(yè)型的中小開發(fā)者而言,技術(shù)的開放為他們的創(chuàng)新提供了更多的可能。

同樣,事實也在不斷證明投桃總會報李,正是由于百度平臺技術(shù)的提供與核心技術(shù)的免費開放,才吸引到了更多更優(yōu)秀的開發(fā)者。對語音技術(shù)來說,一個重要依賴便是“語料”。大量開發(fā)者帶來足夠多的用戶頻繁使用語音功能所積累的語料,讓百度語音有機(jī)會被不斷訓(xùn)練,進(jìn)而提升了準(zhǔn)確率、抗噪率、語義識別準(zhǔn)確性,不斷獲得完善。同時也搭建了有效獲取用戶的生態(tài)系統(tǒng)。

在今年的百度世界大會上,百度首席科學(xué)家吳恩達(dá)就現(xiàn)場演示了百度新一代語音識別技術(shù)。測試顯示在比較嘈雜的環(huán)境下,機(jī)器識別已經(jīng)超過人類。百度語音識別率接近95%,成為目前世界上最先進(jìn)的漢語語音識別技術(shù)。日前資料顯示,百度的漢語安靜環(huán)境普通話語音識別技術(shù)的識別相對錯誤率比現(xiàn)有技術(shù)降低15%以上,識別率已接近97%。而從95%-99%是量變到質(zhì)變的過程,這也許會徹底改變?nèi)伺c設(shè)備的交互方式。

語音技術(shù)的這一突破與百度開放的思維與模式是不無關(guān)系的,包括成立聯(lián)盟將專利拿出來分享,都是以一種更為開放的心態(tài)希望能夠共享語音技術(shù)成果,推動技術(shù)的進(jìn)步和語音產(chǎn)業(yè)發(fā)展,服務(wù)于移動時代。這是一條樸實的道路卻有孕育創(chuàng)新與顛覆的泥土。

聯(lián)盟下的中國式顛覆

所謂顛覆式技術(shù),就是說有一種技術(shù)可以取代原有技術(shù),讓人類需求更好的實現(xiàn),語音識別也是如此。在2011年之前,語音識別技術(shù)主要是采用混合高斯模型。2011年深度學(xué)習(xí)技術(shù)引入語音識別領(lǐng)域,并推進(jìn)了整個工業(yè)界的人工智能技術(shù)應(yīng)用進(jìn)入深度學(xué)習(xí)時代。

而隨著物聯(lián)網(wǎng)、車聯(lián)網(wǎng)的發(fā)展,將會有越來越多的設(shè)備對語音控制提出需求,因為語音識別是以一種非物理接觸式的交互方式,讓機(jī)器擁有真正的“聽覺”,使人們甩掉鍵盤。這將解放用戶的雙手,節(jié)省用戶的時間和體力,以百度新聞的語音播報為例,借助于自然語言處理技術(shù)生成新聞的摘要,在信息嚴(yán)重過載的今天,無異幫助用戶提高了信息獲取的效率。因此未來語音識別功能將向電腦芯片一樣,成為每個智能終端必備的能力。并實現(xiàn)人機(jī)交流之上智慧生活的重要切入口。

語音聯(lián)盟讓我想到了過去英國的ARM,它將技術(shù)專利開放出去,打破了技術(shù)壟斷,現(xiàn)在全球超過95%的智能手機(jī)和平板電腦都采用ARM的技術(shù)架構(gòu),讓各家企業(yè)都能享受到性能高、成本低、能耗低的芯片技術(shù),讓老牌芯片制造商intel備受挑戰(zhàn)。

同樣,語音聯(lián)盟也許就是下一個中國式顛覆,未來通過分享語音技術(shù)專利及成果,可以在人工智能、移動互聯(lián)網(wǎng)、智能終端、智能家居、可穿戴設(shè)備等領(lǐng)域深入發(fā)展。比如用于聲控語音撥號系統(tǒng)、信息網(wǎng)絡(luò)查詢、醫(yī)療服務(wù)、銀行服務(wù)等,為更多產(chǎn)業(yè)上下游企業(yè)提供更多尖端技術(shù),帶動智能語音以及相關(guān)產(chǎn)業(yè)的發(fā)展,形成新的業(yè)態(tài)與增長點。

語音聯(lián)盟通過開放式創(chuàng)新與開放式知識產(chǎn)權(quán)許可的結(jié)合,共享語音技術(shù)成果,孕育出一個連接各種智能硬件設(shè)備并且提供各式各樣服務(wù)的語音交互新平臺。甚至可以想象除了技術(shù)之外,語音識別這種富含人類情感的交流方式,未來的發(fā)展也許不僅僅是一個幫助我們解決問題的功能和應(yīng)用,更是科學(xué)計算中情感與文化的承載與體現(xiàn)。

個人微信公眾號:太保亂談,對游戲感興趣的朋友可關(guān)注:toutiaoyouxi

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2015-12-07
百度牽頭成立的智能語音聯(lián)盟,或?qū)⒊蔀橹袊腁RM
語音技術(shù)作為人工智能的重點研究領(lǐng)域,不僅可以帶來全新的、變革式的人機(jī)交互方式,還有機(jī)會催生出人類和機(jī)器的情感交流。源于語音對人類的重要性,科技巨頭們再一次將目光投到了智能語音領(lǐng)域。

長按掃碼 閱讀全文