語音控制:企業(yè)計算的下一個重大突破

如果說2007年 iPhone 的發(fā)布開啟了近十年來消費者信息傳達(dá)被屏幕和視覺統(tǒng)治的時代,那么,語音將成為繼智能手機(jī)之后企業(yè)科技界下一個最大的顛覆。

蘋果Siri、谷歌助手、微軟小娜、三星Bixby和亞馬遜Alexa等各類設(shè)備和語音助手如雨后春筍般地出現(xiàn),便折射出了一種趨勢的變化:越來越多的用戶,開始從屏幕靠視覺傳達(dá),轉(zhuǎn)向用聲音來傳遞和接受信息。

據(jù) Strategy Analytics 的分析師透露,智能音箱已經(jīng)成為了近年來發(fā)展最快的新硬件市場。到 2023 年,63% 的美國家庭至少保有一臺智能音箱,而這個數(shù)字在 2014 年是 0.03%,2017 年是 16%。

語音技術(shù)在企業(yè)市場的應(yīng)用潛力巨大

在過去的幾十年里,隨著技術(shù)的不斷成熟,從穿孔卡片到鍵盤再到電腦鼠標(biāo)設(shè)備的緩慢發(fā)展,計算機(jī)交互已經(jīng)慢慢變得更加自然。

目前,觸控界面幾乎成了從相機(jī)到汽車在內(nèi)的任何帶有屏幕的設(shè)備的默認(rèn)標(biāo)準(zhǔn)。現(xiàn)在也是時候邁出科技界的另一大步了:和公司的設(shè)備交談。至少在很多電影中,人類已經(jīng)實現(xiàn)了與電腦的交談,從《鋼鐵俠》中的賈維斯到《星際迷航4:暗黑無界》中的著名場景,斯科特試圖向一臺80年代的電腦發(fā)出指令。

盡管語音助手已經(jīng)在手機(jī)上使用多年了——蘋果的Siri在2011年問世。但迄今為止,它們對企業(yè)環(huán)境的影響仍然有限。

而現(xiàn)在,計算能力和機(jī)器學(xué)習(xí)的進(jìn)步使計算機(jī)在無需繁瑣的編碼情況下能夠比人類更好地轉(zhuǎn)錄語音,然后準(zhǔn)確地翻譯出來。并且,新系統(tǒng)可以更有效地自我更新,從錯誤中吸取教訓(xùn),而非需要人為明確的指導(dǎo)。

支持語音的設(shè)備數(shù)量也在持續(xù)飆升,預(yù)計今年將售出超過5000萬臺,到2023年,全球語音技術(shù)產(chǎn)業(yè)預(yù)計將達(dá)到1265億美元。

對于工作人員來說,語音界面能夠帶來很多實際的好處,尤其是與繁瑣的移動鍵盤相比。今年早些時候,斯坦福大學(xué)、華盛頓大學(xué)和美國百度大學(xué)進(jìn)行的一項研究發(fā)現(xiàn),移動設(shè)備的語音輸入速度幾乎是打字速度的三倍,兩種輸入方式的錯誤率差別不大。

語音接口的最大好處之一是可以為企業(yè)業(yè)務(wù)系統(tǒng)提供“通用遠(yuǎn)程控制”。谷歌已經(jīng)證明,語音可用于將計算機(jī)連接到基于人的系統(tǒng),例如在美發(fā)沙龍設(shè)置預(yù)約。

這種連接在企業(yè)界甚至更有意義。因為每個大型組織都有許多不同的應(yīng)用程序,倘若想要在它們之間提供一致的工作流,通常需要進(jìn)行編碼,這可能很慢,而且代價昂貴。但如果所有系統(tǒng)都支持語音,工作人員可以很容易地從一個系統(tǒng)切換到另一個系統(tǒng),而不需要任何顯式集成。

此外,企業(yè)系統(tǒng)之間很可能會開始相互通信。在計算中實現(xiàn)通用標(biāo)準(zhǔn)是非常困難的,而使用語音(盡管明顯效率低下)可能是實現(xiàn)系統(tǒng)集成的一個非常實用的短期解決方案。其實,在消費級市場已經(jīng)看到了這一點,最近有消息稱,亞馬遜的Alexa現(xiàn)在可以與微軟的Cortana“對話”,反之亦然。

所有這些進(jìn)步都意味著,那些為企業(yè)的各種業(yè)務(wù)活動提供聊天和語音接口的企業(yè)數(shù)字助理正在成為主流。

語音也成為創(chuàng)新服務(wù)方式的一部分。例如,Workheld提供創(chuàng)新的現(xiàn)場管理系統(tǒng),以提高施工和服務(wù)流程的生產(chǎn)率。該公司使用機(jī)器學(xué)習(xí)和文本分析技術(shù)自動將客戶工作與最合適的技術(shù)人員匹配,并提供免提語音接口,幫助員工完成維護(hù)步驟。

威脅問題不容忽視

當(dāng)然,目前語音接口仍然存在一些問題,例如,在有大量背景噪音的繁忙辦公室中使用它可能很難。對此,科技公司正致力于尋求解決方案:例如,使用人工智能進(jìn)行更先進(jìn)的降噪,在人群中挑選出你的聲音,進(jìn)行唇語識別,甚至直接通過你的下巴檢測你的話語,而不需要你大聲說出來。

不過,這也帶來了一些潛在危險。例如,所有這些麥克風(fēng)都為非法竊聽和個人跟蹤提供了充足的機(jī)會。正如喬治?奧威爾的《1984》中寫道的那樣:“隱藏的麥克風(fēng)總是有危險的,通過它,你的聲音可能會被接收和識別”。

當(dāng)算法能夠創(chuàng)造出非常精確的合成語音時,公司的安全又將如何通過語音接口來執(zhí)行呢?現(xiàn)在很多公司的“語音詐騙”已經(jīng)凸顯出該問題了:如果企業(yè)首席執(zhí)行官獨特的(但虛假的)聲音被連接到系統(tǒng)上,要求銀行進(jìn)行非正常的電匯,會發(fā)生什么?或者更貼近實際一點,如果你十幾歲的女兒(假的,但聽起來聲音是一樣的)打電話給你說她有麻煩了,需要錢,又該怎么辦?!

總的來說,今年企業(yè)中的語音應(yīng)用應(yīng)該會有巨大的飛躍,主要是通過與聊天機(jī)器人接口的可選語音進(jìn)行交互。

編輯與翻譯:張?zhí)K月

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2018-08-29
語音控制:企業(yè)計算的下一個重大突破
如果說2007年 iPhone 的發(fā)布開啟了近十年來消費者信息傳達(dá)被屏幕和視覺統(tǒng)治的時代,那么,語音將成為繼智能手機(jī)之后企業(yè)科技界下一個最大的顛覆。

長按掃碼 閱讀全文