語(yǔ)音交互不再是幻想,是時(shí)候進(jìn)入說(shuō)聽(tīng)新智能時(shí)代

還記得科幻片《鋼鐵俠》中,托尼·史塔克的AI管家賈維斯嗎?只要托尼一聲呼喚,無(wú)論語(yǔ)速快慢,聲音大小,老賈的程序都能被迅速激活,完美地執(zhí)行托尼的各類語(yǔ)音指令。

隨著科技快速迭代升級(jí),過(guò)去在科幻片中出現(xiàn)的情景,很多都在日后變?yōu)榱爽F(xiàn)實(shí)。賈維斯這樣的語(yǔ)音識(shí)別與交互方式,未來(lái)終將出現(xiàn)在日常生活中。當(dāng)然,普通人不可能像托尼那樣整天背著一套沉重的高科技行頭,聲音的交互也可能出現(xiàn)在生活的各類場(chǎng)景中,比如開(kāi)車、做飯、健身、睡前……

有一種觀點(diǎn)認(rèn)為,未來(lái)人機(jī)交互的創(chuàng)新,不會(huì)再局限于以手機(jī)為載體的功能軟件或服務(wù),從汽車到冰箱再到鬧鐘的各類設(shè)備都將成為新載體,進(jìn)入萬(wàn)物互聯(lián)的新時(shí)代。

萬(wàn)物互聯(lián)時(shí)代的信息交互將極為便捷和通暢,而正如《鋼鐵俠》中的賈維斯一樣,“說(shuō)”和“聽(tīng)”將是這一切的基礎(chǔ)。

“正在輸入”煩透了不如直接說(shuō)話吧!

是不是也有過(guò)這樣的感受:與朋友或同事聊微信時(shí),對(duì)話框上方一直在顯示“對(duì)方正在輸入”,信息卻遲遲出不來(lái),只能逼迫自己耐心等待,碰上緊急事務(wù)更是尤為焦躁。

這時(shí)你會(huì)想:還不如語(yǔ)音通話來(lái)得痛快!

當(dāng)然,上述情形只是針對(duì)人際之間的交流,如果嫌文字輸入不方便,那就干脆撥通對(duì)方手機(jī)號(hào)。那么,如果是人機(jī)之間的互動(dòng)呢?如果人機(jī)之間也能實(shí)現(xiàn)語(yǔ)音對(duì)話,交流將會(huì)方便很多。況且,人際交流還得考慮對(duì)方是否方便接聽(tīng)語(yǔ)音,而人機(jī)交互卻完全不用考慮這個(gè)問(wèn)題。

事實(shí)上,不管是鍵盤還是觸摸屏,文字其實(shí)都是限于我們目前的技術(shù)條件而不得不為之的低效率輸入方式,是一種“妥協(xié)”的產(chǎn)物。

回想我們每個(gè)人自出生以來(lái)的學(xué)習(xí)和交流方式,其實(shí)聲音是最原始也是最自然、最有效率的方式,隨著未來(lái)語(yǔ)音識(shí)別技術(shù)的突破,一“說(shuō)”一“答”的信息獲取方式將變得更為普遍。

不久前,“互聯(lián)網(wǎng)女皇”瑪麗·米克爾的2016年《互聯(lián)網(wǎng)趨勢(shì)》(Internet Trends)報(bào)告中,就已經(jīng)將超過(guò)十分之一的篇幅給了語(yǔ)音,遠(yuǎn)遠(yuǎn)多于時(shí)下熱門的汽車、直播等領(lǐng)域。

瑪麗·米克爾認(rèn)為,語(yǔ)音正在被重塑,成為人機(jī)交互的新范式。在過(guò)去75年里,每10年就有一次人機(jī)交互的重大革新,人類對(duì)機(jī)器的操作,經(jīng)歷了從物理手柄按鍵,到物理鍵盤鼠標(biāo),再到觸摸屏的過(guò)程,而現(xiàn)在輪到了語(yǔ)音。

“女皇”的結(jié)論也相當(dāng)肯定:未來(lái),語(yǔ)音將從根本上優(yōu)化人們的生活方式。

語(yǔ)音的媒介就是音頻,過(guò)去人們提起音頻,更多想到的是廣播電臺(tái),但移動(dòng)互聯(lián)網(wǎng)的出現(xiàn)徹底改變了這種固有印象。

移動(dòng)互聯(lián)網(wǎng)時(shí)代,人們的碎片化時(shí)間越來(lái)越多,這為“聽(tīng)”提供了無(wú)限多的使用場(chǎng)景。相比視頻、圖文等其他媒介形式,音頻具有獨(dú)特的伴隨屬性,你可以一邊說(shuō)和一邊聽(tīng)的同時(shí)不妨礙做其他事情,比較典型的場(chǎng)景有做飯、開(kāi)車、健身等,音頻內(nèi)容和語(yǔ)音交互技術(shù)都很可能出現(xiàn)在生活中的各個(gè)角落。

就國(guó)內(nèi)市場(chǎng)而言,音頻行業(yè)已經(jīng)成功從小眾走向大眾。第三方營(yíng)銷數(shù)據(jù)技術(shù)公司秒針系統(tǒng)于去年四季度發(fā)布的報(bào)告顯示,國(guó)內(nèi)城市人口中每3人里就有1人經(jīng)常收聽(tīng)移動(dòng)音頻。而包括喜馬拉雅FM、荔枝FM、蜻蜓FM、考拉FM在內(nèi)的數(shù)家音頻公司已經(jīng)贏得了大批用戶的青睞,這已經(jīng)為未來(lái)語(yǔ)音交互的變革打下基礎(chǔ)。

“賈維斯”還很遠(yuǎn),全場(chǎng)景模式就在眼前

提前感受到風(fēng)口的是那些科技巨頭們,谷歌Google Now、蘋果Siri、微軟Cortana和亞馬遜的Alexa都在試圖幫助消費(fèi)者通過(guò)聲音來(lái)與周圍的世界進(jìn)行交互,如今已能夠?yàn)橛脩衾首x短信或電子郵件,回答實(shí)用的問(wèn)題,控制手機(jī)功能,處理基本的通訊任務(wù),瀏覽地圖等等。

而從具體的使用場(chǎng)景來(lái)看,未來(lái)語(yǔ)音交互的方式會(huì)向兩個(gè)明確的方向發(fā)展。

一種是“賈維斯”式的個(gè)人管家模式,即隨身攜帶的一套集成式智能穿戴設(shè)備,用戶一有需求即可與“賈維斯”溝通,后者第一時(shí)間幫助用戶提供信息或解決問(wèn)題。

另一種則可以被稱之為全場(chǎng)景模式,在生活里的各種軟硬件設(shè)備中引入交互系統(tǒng),用戶走到哪兒就能說(shuō)到哪兒,比如在廚房就說(shuō)給冰箱聽(tīng),在車?yán)锞驼f(shuō)給汽車聽(tīng),在床頭就說(shuō)給鬧鐘聽(tīng)。

未來(lái)兩種模式都會(huì)有很大的想象空間,當(dāng)然現(xiàn)在唯一欠缺的,同時(shí)也最重要的是,還需要突破語(yǔ)音識(shí)別的技術(shù)瓶頸,這個(gè)瓶頸一旦突破,一切都將變得容易,但目前來(lái)看仍頗為困難,相比之下,移步換景的全場(chǎng)景模式會(huì)更早一些落地,甚至三年之內(nèi)就能初具規(guī)模。目前,很多智能設(shè)備廠商都已經(jīng)配備了智能電子屏,并紛紛接入音頻服務(wù),提供觸屏和語(yǔ)音等多種交互方式。

全場(chǎng)景模式的背后,仍然是未來(lái)音頻作為伴隨性媒體的巨大優(yōu)勢(shì)。有觀點(diǎn)認(rèn)為,未來(lái)媒體會(huì)往兩個(gè)大方向演化,一個(gè)方向是以VR為代表的沉浸式媒體,另一個(gè)則是以移動(dòng)音頻為代表的伴隨性媒體。

有一個(gè)直觀的數(shù)據(jù)能夠說(shuō)明趨勢(shì):目前音頻分享平臺(tái)喜馬拉雅FM的活躍用戶日均收聽(tīng)時(shí)長(zhǎng)超過(guò)了108分鐘,其背后是基于大數(shù)據(jù)技術(shù)的個(gè)性化推薦,以及喜馬拉雅開(kāi)放平臺(tái)打造的各個(gè)生活場(chǎng)景分發(fā),使得許多人一天聽(tīng)音頻的累計(jì)總時(shí)長(zhǎng)遠(yuǎn)遠(yuǎn)超過(guò)了看視頻的時(shí)長(zhǎng)。這種模式實(shí)際上是為用戶創(chuàng)造了一個(gè)“萬(wàn)物有聲”的世界,讓用戶隨時(shí)隨地都能有聲音的陪伴。

“麥克風(fēng)+喇叭”:開(kāi)放平臺(tái)跟眼睛搶場(chǎng)景

全場(chǎng)景模式對(duì)移動(dòng)音頻創(chuàng)業(yè)者們來(lái)說(shuō)即是機(jī)遇,但同時(shí)也帶來(lái)了新的挑戰(zhàn)。擺在音頻創(chuàng)業(yè)者們面前一個(gè)巨大的難題是,如何發(fā)現(xiàn)新的內(nèi)容渠道出口,讓伴隨性無(wú)處不在,勢(shì)必要找到智能手機(jī)之外的新載體。無(wú)處不在的智能家居和智能硬件,自然而然進(jìn)入了創(chuàng)業(yè)者的視線。而要讓硬件創(chuàng)業(yè)者自愿接受音頻內(nèi)容,這又是一件較為復(fù)雜的工作。

從這個(gè)角度而言,喜馬拉雅的開(kāi)放平臺(tái)或許值得我們參考。說(shuō)起內(nèi)容平臺(tái)的開(kāi)放,其實(shí)并不陌生。早前今日頭條推出了“千人萬(wàn)元”以及天天快報(bào)推出的“芒種”計(jì)劃,但這些不過(guò)都是針對(duì)上游的內(nèi)容生產(chǎn),而喜馬拉雅開(kāi)放平臺(tái)則獨(dú)辟蹊徑地瞄準(zhǔn)下游的內(nèi)容分發(fā),將平臺(tái)上既有的音頻內(nèi)容,通過(guò)提供豐富的音頻工具和內(nèi)容接口,為各類軟硬件廠商提供有聲內(nèi)容的一站式解決方案,已先后與400多家公司達(dá)成合作。

這也意味著,未來(lái)人們?cè)谌魏紊顖?chǎng)景下,都可能與喜馬拉雅FM產(chǎn)生交集。想象一下,在你睡覺(jué)前,智能燈具推薦你一則溫馨小故事或者助眠音樂(lè),讓你欣然入眠;在你起床后,智能鬧鐘或智能冰箱知道你即將開(kāi)始忙碌的一天,為你推薦最感興趣的晨間新聞;而在你開(kāi)車遇見(jiàn)塞車時(shí),車載音頻系統(tǒng)會(huì)推薦你喜愛(ài)的歌曲或者脫口秀以緩解你的不快……

“從長(zhǎng)遠(yuǎn)來(lái)看,音頻的真正價(jià)值才剛剛開(kāi)啟。”此前在公開(kāi)場(chǎng)合,喜馬拉雅FM聯(lián)席CEO余建軍曾如是說(shuō)。眼下音頻創(chuàng)業(yè)者可能想到的都是和喜馬拉雅的一樣的路,如何將他們的內(nèi)容從下游分發(fā)出去。但長(zhǎng)期來(lái)看,如何將聲音真正融入生活,將聲音變成水和電一樣隨取隨用,這種基于場(chǎng)景的內(nèi)容消費(fèi)可能才是最終出路。

換句話說(shuō),音頻平臺(tái)們最終想要達(dá)成的愿景是,在大多數(shù)的生活場(chǎng)景下,用“喇叭+麥克風(fēng)”的交互方式,深入到用戶日常生活的24小時(shí),打造一個(gè)聲音無(wú)處不在的全新世界。這里面每一步的實(shí)現(xiàn)都并非輕而易舉,但一個(gè)關(guān)于“說(shuō)”和“聽(tīng)”的超級(jí)時(shí)代,或許正在來(lái)臨!

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2016-07-26
語(yǔ)音交互不再是幻想,是時(shí)候進(jìn)入說(shuō)聽(tīng)新智能時(shí)代
還記得科幻片《鋼鐵俠》中,托尼·史塔克的AI管家賈維斯嗎?只要托尼一聲呼喚,無(wú)論語(yǔ)速快慢,聲音大小,老賈的程序都能被迅速激活,完美地執(zhí)行托尼的各類語(yǔ)音指令。

長(zhǎng)按掃碼 閱讀全文