語(yǔ)音不只是消滅鍵盤,而是要改變?nèi)藱C(jī)交互之道

3月22日,在語(yǔ)音搜索媒體開放日活動(dòng)上,百度宣布2015年其語(yǔ)音搜索需求總數(shù)增長(zhǎng)了3倍,粘性用戶則有60%的需求通過語(yǔ)音表達(dá)。語(yǔ)音搜索正在從極客用戶的小眾玩法,升級(jí)為大眾用戶的通用工具。百度副總裁王海峰在活動(dòng)提到智能語(yǔ)音搜索的未來,能聽會(huì)說,未來將要消滅鍵盤。語(yǔ)音未來會(huì)取代鍵盤嗎?或許會(huì)。但我認(rèn)為,語(yǔ)音的價(jià)值將遠(yuǎn)遠(yuǎn)超過鍵盤,它將是人和機(jī)器最核心的交互方式。

語(yǔ)音搜索取代鍵盤只是時(shí)間問題

百度認(rèn)為語(yǔ)音會(huì)取代鍵盤,更多是從搜索角度來談。

鍵盤在搜索中的價(jià)值主要是輸入文字,在移動(dòng)時(shí)代,使用智能手機(jī)進(jìn)行文字輸入,效率遠(yuǎn)遠(yuǎn)不能與PC媲美,尤其是在移動(dòng)、戶外等場(chǎng)景下。除了輸入文字不方便之外,Apple Watch等可穿戴設(shè)備、智能家居、智能電視、VR眼鏡,它們的輸入能力比手機(jī)更弱。語(yǔ)音技術(shù)讓移動(dòng)互聯(lián)網(wǎng)和IoT(萬(wàn)物互聯(lián))時(shí)代各種設(shè)備的“文字錄入”這一痛點(diǎn)迎刃而解。

任何新興技術(shù)發(fā)展都要經(jīng)歷從不成熟到成熟 過程。語(yǔ)音搜索技術(shù)曾經(jīng)面臨著許多難題,噪音干擾、用戶口音、中英混雜、移動(dòng)網(wǎng)速,這些都是曾經(jīng)存在的難點(diǎn)。不過,近年來隨著語(yǔ)音技術(shù)的發(fā)展,尤其是以深度學(xué)習(xí)、自然語(yǔ)言處理為核心的人工智能技術(shù)被應(yīng)用在語(yǔ)音技術(shù)中,各種問題都在成為過去式。百度語(yǔ)音搜索、Siri、Cortana等產(chǎn)品這幾年都取得了“從量變到質(zhì)變”的進(jìn)步。百度在2015年公布了一項(xiàng)研究成果:借助于深度學(xué)習(xí)技術(shù),百度語(yǔ)音識(shí)別能力達(dá)到世界領(lǐng)先水平。

語(yǔ)音搜索不只是解決“識(shí)別”問題,它并不是將用戶語(yǔ)音識(shí)別成文字再進(jìn)行文字搜索這么簡(jiǎn)單。搜索引擎嘗試通過多輪對(duì)話理解語(yǔ)義,理解用戶在說出這段話背后的需求,比如用戶可以對(duì)著手機(jī)百度問“孫莉的電視劇”,搜索出更加熱門的“孫儷的電視劇”后再補(bǔ)充一句“茉莉的莉”,這樣搜索引擎就會(huì)給出孫莉而不是孫儷的作品結(jié)果。它還可以糾錯(cuò)、識(shí)別中英文混雜、甚至于用戶對(duì)話來獲取更準(zhǔn)確的信息,如果用戶看文字不方便,搜索引擎還能通過聲音來傳遞最優(yōu)選的那個(gè)搜索結(jié)果。借助于語(yǔ)音搜索,搜索引擎更像是能聽會(huì)說的助理。

因此至少在搜索層面,語(yǔ)音取代鍵盤并不存在問題。鑒于鍵盤還承擔(dān)了一部分“書寫”功能,一些場(chǎng)合人類更需要“寫”而不是“說”,所以鍵盤還會(huì)有存在的價(jià)值,比如寫文章、做表格,所以鍵盤短期內(nèi)不會(huì)消失。

為什么人們期望鍵盤消失?

鍵盤是一個(gè)偉大的發(fā)明,它改變了人們產(chǎn)生文字的方式,變寫字為打字,更重要的是,它是人類與機(jī)器交互的核心方式:PC時(shí)代是物理鍵盤,移動(dòng)時(shí)代是虛擬鍵盤。

不過,鍵盤生來就是不自然的設(shè)計(jì),全鍵盤、九宮格布局都需要人類去學(xué)習(xí)適應(yīng),輸入的熟練程度差距很大,不會(huì)拼音的人可能現(xiàn)在還依賴手寫輸入。語(yǔ)音相對(duì)于鍵盤來說,是人類自然獲取的能力,小孩子不用學(xué)拼音就可以通過語(yǔ)音進(jìn)行搜索、輸入、溝通。更加自然,意味著門檻更低,對(duì)于所有人來說,使用更簡(jiǎn)單、更舒服、更直接。

除了自然之外,語(yǔ)音效率更高。為什么會(huì)有速記這個(gè)行業(yè)?因?yàn)榻^大多數(shù)人打字都無法跟上說話的速度——中文還不算語(yǔ)速最快的,還有語(yǔ)速更快的語(yǔ)言。百度的數(shù)據(jù)統(tǒng)計(jì)表明,打字平均要1s/字,而語(yǔ)音只要100ms/字,是前者十分之一。因此人們?cè)诤芏鄨?chǎng)合更愿意口述而不是書寫,比如搜索時(shí),再比如洽談時(shí),很多人更愿意用電話而不是微信。換個(gè)角度來看,語(yǔ)音未來還有望被用在同聲傳譯、演講速記等領(lǐng)域。

語(yǔ)音相對(duì)于文字來說還有一個(gè)優(yōu)勢(shì),是傳遞更生動(dòng)的信息。從聲音中我們可以聽到“笑紋”,可以感受對(duì)方的情緒,漢語(yǔ)里同樣的文字經(jīng)過不同的語(yǔ)調(diào)之后就是完全不同的意思??梢韵胂?,未來語(yǔ)音搜索可以通過分析用戶的語(yǔ)音語(yǔ)調(diào),能更好地理解用戶的情緒。反過來借助于語(yǔ)音合成技術(shù),用戶可以接受機(jī)器的語(yǔ)音播報(bào),或者語(yǔ)音結(jié)合圖文,獲取信息更加豐富立體。

語(yǔ)言是人類與生俱來的天賦之能。PC時(shí)代我們更多使用文字,而移動(dòng)時(shí)代,隨著語(yǔ)音技術(shù)的發(fā)展,我們將更少使用鍵盤(實(shí)體和虛擬),更多地使用語(yǔ)音與機(jī)器自然交互。

語(yǔ)音價(jià)值為什么遠(yuǎn)遠(yuǎn)大于鍵盤?

語(yǔ)音在理論上完全可以取代鍵盤的“輸入”功能,不過,它在未來的價(jià)值將遠(yuǎn)遠(yuǎn)大于鍵盤。

一方面,語(yǔ)音讓我們和機(jī)器之間可以有更遠(yuǎn)的物理距離。

聲音的傳播距離遠(yuǎn)遠(yuǎn)大于我們手指的長(zhǎng)度?,F(xiàn)在不論是手機(jī)還是電腦,只要用鍵盤打字,都必須在設(shè)備旁邊。語(yǔ)音命令,尤其是近場(chǎng)識(shí)別技術(shù)和休眠喚醒技術(shù),讓我們可以跟房間另一個(gè)角落的機(jī)器交互,只要它聽得到。一個(gè)最簡(jiǎn)單的例子是電視:我們距離電視屏幕很遠(yuǎn),怎么去操作它?現(xiàn)在還需要遙控器,未來就可以用聲音命令換臺(tái)了。

另一方面,語(yǔ)音/語(yǔ)言,是人和機(jī)器最核心的交互方式。

我們不只是通過語(yǔ)音去搜索引擎查天氣問問題,還可以直接下單訂咖啡。

未來,智能機(jī)器人將會(huì)成為家庭的標(biāo)配,人類如何去控制這些機(jī)器人?最可能的方式,至少在各種科幻電影中最常見的想象,均是語(yǔ)音交互,畢竟未來的機(jī)器人不會(huì)有屏幕和鍵盤。未來的場(chǎng)景可能是這樣的:你讓機(jī)器人給你制定一張表格,你口述機(jī)器人幫你完成文章,這中間根本沒用鍵盤什么事情。

機(jī)器要能充分理解人類的命令,必須要具備語(yǔ)音和語(yǔ)義識(shí)別能力,并且還能不斷學(xué)習(xí)變得越來越“聽得懂人話”,這正是百度等科技巨頭在探索的事情。

短期來看,語(yǔ)音最大的價(jià)值是讓人更便捷、自然地與機(jī)器交互,尤其是輸入、搜索,目前的發(fā)展來看在服務(wù)獲取、命令執(zhí)行上還不夠成熟。不過現(xiàn)在百度們?cè)谥悄苷Z(yǔ)音搜索上的探索,無疑是在給語(yǔ)音未來成為人機(jī)交互的核心手段打下堅(jiān)實(shí)基礎(chǔ)。

微博@互聯(lián)網(wǎng)阿超 微信 羅超(luochaotmt)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-03-29
語(yǔ)音不只是消滅鍵盤,而是要改變?nèi)藱C(jī)交互之道
3月22日,在語(yǔ)音搜索媒體開放日活動(dòng)上,百度宣布2015年其語(yǔ)音搜索需求總數(shù)增長(zhǎng)了3倍,粘性用戶則有60%的需求通過語(yǔ)音表達(dá)。語(yǔ)音搜索正在從

長(zhǎng)按掃碼 閱讀全文