從“知音”看搜狗人工智能之道:深耕智能語音交互

在日新月異的移動互聯(lián)網(wǎng),AI、AR/VR、機(jī)器人、無人駕駛等高大上的“黑科技”層出不窮,其中AI(人工智能)被譽(yù)為“皇冠上的寶石”,也是全球頂級科技公司和科學(xué)家們孜孜以求共同探索的“神秘之境”。

人工智能是對人的意識、思維的信息過程的模擬,來賦予計(jì)算機(jī)系統(tǒng)或者機(jī)器像人類一般思考的能力,甚至可能在某些方面超越人類。正因?yàn)槿斯ぶ悄艿木薮鬂摿蛯?shí)用價值,近年來,谷歌、微軟、Facebook 、IBM、BAT、搜狗等國內(nèi)外科技公司不約而同斥巨資加碼人工智能產(chǎn)業(yè),希望為未來提早布局。

人工智能不應(yīng)沉溺在技術(shù)的美感里

不過,盡管風(fēng)頭正勁的人工智能吸引著大量資本和資源的流入,產(chǎn)業(yè)上游的公司也不斷描繪出各種充滿想象力的技術(shù)構(gòu)想、產(chǎn)業(yè)愿景,但實(shí)際創(chuàng)造的應(yīng)用和服務(wù)卻與理想存在著巨大的鴻溝。

比如,深度學(xué)習(xí)作為人工智能的重要分支,更多的存在于科學(xué)家、工程師們的實(shí)驗(yàn)室,普通人對此幾乎一無所知,也難以知曉其在日常生活的具體應(yīng)用;而諸如無人駕駛、無人機(jī)等被熱炒的人工智能概念,國內(nèi)一些公司喊出“五年內(nèi)要讓無人汽車開上路”、“改變交通和出行”的豪言壯語,卻有意無意的忽略了在實(shí)際交通出行場景的諸多難點(diǎn)。

在我看來,一些產(chǎn)業(yè)公司的自嗨是為了更好的吸引資本,用戶卻更期待人工智能可以不止于技術(shù)噱頭,能帶來真正接地氣、改變生活的服務(wù)。

“不要沉溺在技術(shù)的美感里?!弊鳛槿斯ぶ悄茴I(lǐng)域的一名探索者,搜狗CEO王小川的話揭示了當(dāng)前人工智能產(chǎn)業(yè)現(xiàn)狀背后的主因。他認(rèn)為,很多人工智能公司秀出的產(chǎn)品好像很聰明了,但演示和實(shí)戰(zhàn)起來還是很大的區(qū)別,因此要給過熱的人工智能產(chǎn)業(yè)去掉一些光環(huán),而要思考它的技術(shù)和市場瓶頸在哪里。

“現(xiàn)在的趨勢是,越是專業(yè)化的東西,機(jī)器就越有取代人類的趨勢,反而是那些看似稀松平常的東西,像日常的服務(wù)、對話,機(jī)器就搞不定。”人工智能的發(fā)展規(guī)律也的確如此。

今年3月,谷歌AlphaGo在與世界圍棋高手李世石的“人機(jī)大戰(zhàn)”中,出人意料以4:1的懸殊比分取勝,令人人咋舌,還有人將此解讀為“機(jī)器人將超越人類的開端”。但事實(shí)上,在“人機(jī)大戰(zhàn)”開始前,搜狗CEO王小川曾預(yù)測:不僅僅是圍棋,人工智能在其他博弈類的封閉游戲里,也會橫掃一切,完勝人類。這是因?yàn)锳lphaGo可以通過不斷的深度學(xué)習(xí)和進(jìn)化,無時無刻的進(jìn)行自升級,最后經(jīng)過幾十萬次的訓(xùn)練后在下棋時幾乎不會出錯;而人是情感動物,有心理波動,有狀態(tài)好壞,因此總會露出破綻。

李世石這樣評價AlphaGo和人工智能——首先對手不是人類。新鮮的感覺有很多,我要去適應(yīng)他,首先就是心理方面,非常的專注。我繼續(xù)和他下不一定能贏,因?yàn)闊o法比他更專注,這些方面是贏不了他的?!?/p>

不過,AlphaGo給中國帶來的震撼畢竟是巨大的,它給人們進(jìn)行了一次人工智能的啟蒙運(yùn)動。谷歌執(zhí)行董事長施密特這樣評價人機(jī)大戰(zhàn)——“無論最終結(jié)果是什么,贏家都是人類。”

搜狗知音突破智能語音交互“關(guān)口”

在我看來,人工智能在國內(nèi)的發(fā)展,首先要思考清楚“應(yīng)用場景”的問題。比如對于交通出行,現(xiàn)有的人工智能對于叫車服務(wù)中的大數(shù)據(jù)分析以及運(yùn)力調(diào)配有明顯的提升作用,但應(yīng)用于無人駕駛,不僅現(xiàn)有技術(shù)不夠成熟,國內(nèi)的交通體系、配套設(shè)施都難以支持。

搜狗作為國內(nèi)科技公司中“技術(shù)派”代表,此前也一直在人工智能領(lǐng)域低調(diào)深耕,其重點(diǎn)突破的就是在用戶場景和技術(shù)創(chuàng)新兩者之間找到最佳平衡點(diǎn)。王小川自己給搜狗人工智能的定下一個未來目標(biāo)——要讓技術(shù)使得生活變得更加自然。

“說了那么多人臉識別、語音識別、人機(jī)交互,但你換位從用戶角度想,用戶能夠得到什么?他會怎么理解這些看似高大上的東西呢?這個技術(shù)能否帶給他們幸福感?這才是從技術(shù)跨越到產(chǎn)品的關(guān)鍵?!?/p>

隨著移動互聯(lián)網(wǎng)的深入應(yīng)用和AI概念興起,智能語音日益成為移動互聯(lián)網(wǎng)用戶的痛點(diǎn),廠商們紛紛將各自的語音交互技術(shù)應(yīng)用于各大智能終端——語音輸入、語音撥號、語音導(dǎo)航、語音拍照……不過,盡管智能語音應(yīng)用方興未艾,但并沒有哪兒家科技公司推出最成熟的、一站式解決方案,用戶體驗(yàn)語音交互服務(wù)的體驗(yàn)并不理想。

搜狗多年來深耕的恰恰是智能語音交互這一重要的人工智能應(yīng)用場景,其領(lǐng)先的語音交互技術(shù)在搜狗輸入法、地圖導(dǎo)航等移動產(chǎn)品上得到成熟的應(yīng)用。為了幫助用戶擺脫傳統(tǒng)語音交互過于機(jī)械的操作方式、過高的出錯率和和低效的服務(wù)體驗(yàn),今年8月,搜狗推出全新語音交互引擎“知音”。

據(jù)介紹,知音引擎的語音識別使用了目前業(yè)界最先進(jìn)的“端到端”模型,技術(shù)上更好地解決了用戶在說話快過程中的吞音問題,同時在訓(xùn)練方法上使用了一種“主動學(xué)習(xí)”方法。通過“端到端”模型以及硬件加速,搜狗語音的識別速度提升了3倍,識別錯誤率降低30%,大大降低了由于口音以及嘈雜環(huán)境帶來的錯誤率。作為搜狗在自然交互方面的重要成果,知音能夠提供人機(jī)交互的完整解決方案,目前已經(jīng)具備了從聽(語音識別)到理解思考(語義理解)再到說(語音合成)的完整閉環(huán)能力。

據(jù)搜狗CTO楊洪濤介紹,搜狗從12年開始研發(fā)智能語音技術(shù),并在13年開始進(jìn)行深度學(xué)習(xí),目前搜狗輸入法語音識別準(zhǔn)確率已超過97%,輸入頻次達(dá)到每天1.4億次,較去年同期增長了55%。除了在搜索和輸入法方面的應(yīng)用,搜狗未來還將把智能語音交互應(yīng)用到物聯(lián)網(wǎng)、車聯(lián)網(wǎng)和人工智能等各個方面,并嘗試接入更多的終端。

可以說在人工智能時代,智能語音交互不僅愈發(fā)成為連接用戶與服務(wù)的重要“媒介”,也逐漸成為廠商們掘金AI產(chǎn)業(yè)的好生意。打鐵還需自身硬,隨著搜狗知音、搜狗輸入法等語音產(chǎn)品開花結(jié)果,搜狗也在探尋人工智能的道路上底氣變的更足、步子也邁的更大。今年4月,搜狗宣布捐贈清華大學(xué)1.8億元人民幣,共同成立“天工智能計(jì)算研究院”,重點(diǎn)開展人工智能領(lǐng)域的前沿技術(shù)研發(fā),研發(fā)成果將應(yīng)用于搜狗下一代產(chǎn)品中。

業(yè)內(nèi)人士認(rèn)為,目前科技公司探索人工智能存在一個盲點(diǎn)——總是在找“風(fēng)口”而不是“關(guān)口”,風(fēng)口往往聚集了大批的競爭者,容易出現(xiàn)泡沫;而關(guān)口才是解決當(dāng)前人工智能發(fā)展瓶頸之所在,突破那個瓶頸,就可能開創(chuàng)一個新天地。

以搜狗“知音”為例,其從語音交互產(chǎn)品的體驗(yàn)瓶頸出發(fā),發(fā)揮互聯(lián)網(wǎng)最大輸入法的語音數(shù)據(jù)優(yōu)勢,把數(shù)據(jù)和用戶優(yōu)勢資源轉(zhuǎn)化為人工智能技術(shù)優(yōu)勢,最后深化人工智能技術(shù)推廣應(yīng)用,做大做強(qiáng)整個語音交互的相關(guān)智能產(chǎn)業(yè)。在我看來,這才是完成了人工智能的一個正循環(huán)。

展望

正如搜狗CEO王小川所言:“搜狗目前已在語音識別領(lǐng)域取得了重大突破,未來一方面將通過與清華合作進(jìn)行人工智能領(lǐng)域前沿技術(shù)研發(fā),另一方面也將在自然交互與知識計(jì)算上不斷完善自身產(chǎn)品與服務(wù),成為后搜索時代行業(yè)的引領(lǐng)者。”

從聯(lián)姻清華加碼產(chǎn)業(yè)研發(fā)投入,再到相繼誕生明醫(yī)搜索、知音引擎等應(yīng)用服務(wù),搜狗人工智能之道也更加清晰——從技術(shù)美感向真實(shí)服務(wù)進(jìn)階,回歸“技術(shù)讓生活變得更加自然”的初心。而放眼整個移動互聯(lián)網(wǎng),人工智能在電商、社交、出行、醫(yī)療、教育等領(lǐng)域的應(yīng)用價值也日益凸顯,幸運(yùn)的是各個領(lǐng)域的巨頭也都沒有固步自封,紛紛以擁抱姿態(tài)加入布局人工智能的產(chǎn)業(yè)浪潮?;蛟S在未來我們可以說,智能手機(jī)開啟了移動互聯(lián)網(wǎng)的第一個10年,而人工智能則主導(dǎo)了移動互聯(lián)網(wǎng)的第二個10年。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-10-17
從“知音”看搜狗人工智能之道:深耕智能語音交互
人工智能如何從理想照進(jìn)現(xiàn)實(shí)?

長按掃碼 閱讀全文