人工智能商業(yè)化來襲?智能音箱爆發(fā)進入倒計時

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

這是BAT下半年的其中一個“戰(zhàn)場”。

2014年底,亞馬遜在官網(wǎng)悄悄地發(fā)布了Echo,但估計就連亞馬遜自己也沒想到,這個看上去“簡潔得有點簡陋”的奇怪音箱,居然能夠在日后賣出800多萬臺,不僅直接給亞馬遜帶來將近10億美元營收,甚至在Kindle之后成為又一款消費者所認可的終端。

Echo之后所代表的技術(shù)趨勢并不“隱晦”:智能語音技術(shù)落地點,全新交互方式,全新服務(wù)接口這種概念的分析早就被寫了幾百遍。但另外一邊卻是赤裸裸的現(xiàn)實——一貫緊跟全球消費電子市場的中國,在智能語音的具體商業(yè)化這件事上卻“落后”了。

好在,“落后”并不意味著錯過,反之因為“落后”,讓整個行業(yè)積聚了非常強大的力量,隨時有可能爆發(fā)出來。換句話說,2017年很可能會成為中國智能音箱市場最難得的“黃金發(fā)展期”。

兩個星期,BAT全部進入戰(zhàn)場

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

雖然這早已不是BAT在同一個領(lǐng)域中爭高下,但在兩周內(nèi)讓3家巨頭同時進入“戰(zhàn)場”,智能語音的魅力的確很大。第一個又動作的是騰訊,在兩周之前的騰訊云峰會上,騰訊云就發(fā)布了全新的智能語音產(chǎn)品“騰訊云小微”。

而小微主要包括了3個開放性的平臺:能夠通過SDK接入硬件的硬件開放平臺;包含騰訊各種自由內(nèi)容、應(yīng)用資源的Skill開放平臺;以及能夠讓機器不斷學(xué)習(xí)和決策的小微服務(wù)機器平臺。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

有趣的是,在官方資料中,騰訊還提到了自己的一點優(yōu)勢,小微的所有能力來自于微信AI團隊。后者之前實際上已經(jīng)將語音識別、加入語義分析技術(shù)的語音輸入、語音轉(zhuǎn)文字、等功能添加到微信當(dāng)中。

“BA”則顯得更為默契,將自己的智能音箱產(chǎn)品的發(fā)布都定在了7月5號,也就是昨天。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

在昨天是上午的百度“Creat 2017”AI開發(fā)者大會中,更新的DuerOS成為了最重要的發(fā)布環(huán)節(jié)。百度在這次大會上也祭出了大手筆——聯(lián)合數(shù)家音箱生產(chǎn)、語音交互技術(shù)提供商,為其他第三方產(chǎn)品制造商、開發(fā)者提供軟硬件一體化解決方案。

百度同時還在開發(fā)者大會現(xiàn)場宣布了對KITT.AI的收購,后者在“熱詞檢測(喚醒)”、“智能語音對話”這兩項與智能語音息息相關(guān)的技術(shù)上有很不錯的積累。但同時百度并沒有打算“獨吞”這些先進技術(shù),而是將其語音能力和自然語言能力融入平臺,向合作伙伴免費開放,官方將其稱之為“賦能開放”。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

短暫的午休之后,阿里終于“最后一個”加入進來,畫風(fēng)略微不同的他們發(fā)布了“天貓精靈 X1”智能音箱。值得稍微提一嘴的是,有業(yè)內(nèi)人士向雷鋒網(wǎng)爆料:“阿里這款智能音箱實際是來自思必馳的方案。”但硬件本身或許并不是“天貓精靈 X1”最為重要的特點,關(guān)鍵還是在于阿里已經(jīng)在其之上實現(xiàn)了聲紋識別以及支付環(huán)節(jié)的打通。

這也符合業(yè)內(nèi)對于阿里進軍智能音箱的一貫預(yù)期:阿里智能音箱的最大挑戰(zhàn)、同時最大的優(yōu)勢是購物。依托電商建立龐大帝國的阿里不可能不做購物,但這項服務(wù)本身放在語音上面來進行有挑戰(zhàn),像Echo Show那樣帶有顯示屏的智能音箱或許更適合這種任務(wù),但那樣的產(chǎn)品同樣需要繼續(xù)等待。

對于BAT的新動向,Rokid智能音箱負責(zé)人文杰也接受了雷鋒網(wǎng)的采訪:

BAT進軍智能音箱這件事對于我們來說算不上威脅,倒不如說是一種機遇。我們很期待他們接下來在這方面的服務(wù)端口開放。

對此,喜馬拉雅副總裁李海波也有著類似的觀點:

雖然我們有打造自己的音箱,但是我們也會將自己的服務(wù)開放出去,別的智能音箱產(chǎn)品也能夠調(diào)用我們的音頻內(nèi)容資源。因為我們關(guān)心的只是單個用戶在喜馬拉雅中停留的時間。”

先期引爆的英文語音市場

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

早前,美國市場研究公司Statista曾做過相關(guān)的統(tǒng)計,2016年美國的智能家居市場銷售額為97億美元,而中國僅有5.2億美元。普及率的增長更是驚人,美國的數(shù)值為5.8%,而中國僅為0.1%。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?外國調(diào)研機構(gòu)給出的亞馬遜官方硬件產(chǎn)品銷售情況圖

但由于是大洋彼岸的關(guān)系,也有不少人曾經(jīng)對亞馬遜Echo“夸張”的銷售數(shù)據(jù)提出過質(zhì)疑,雷鋒網(wǎng)就此也詢問了國內(nèi)某智能音箱生產(chǎn)商:

去年亞馬遜Echo智能音箱的銷售效果的確不錯,在國內(nèi)它總的生產(chǎn)量剛超過800萬臺,其中初期的Echo和簡化版Echo Dot差不多對半。國內(nèi)銷售量第一名可能只有它的1/100。

參考目前Echo和Echo Dot分別定價179/49美元,光是這800萬臺設(shè)備就已經(jīng)能夠給亞馬遜帶來10億美元的營收,這還不算在使用音響之后所帶來的服務(wù)訂購、網(wǎng)上購物等二次消費。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

從原理上說,智能音箱的代表產(chǎn)品,亞馬遜Echo背后的Alexa,以及它的前輩Siri,實際上都屬于智能語音技術(shù)。其核心非常簡要——要讓機器在語音對話這一環(huán)節(jié)擁有近似于人的能力。

盡管語音對話是人類平日做得最多的動作之一,它的難度卻不可小覷。從語音到文字的轉(zhuǎn)換、機器語音的發(fā)聲、再到多句語音的上下文理解,這些環(huán)節(jié)在沒有人工智能技術(shù)之前遲遲未能取得進展。

載體則是另外一個因素,雖然擁有基礎(chǔ)對話能力的Siri早在6年前就登陸了手機。但智能手機的主要操作依然停留在觸摸和顯示之上,所以大家并不會經(jīng)常使用這一功能,甚至只會在不小心長按Home鍵的時候才會想起這一功能。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

相比之下,將語音交互能力獨立出來,并且只能通過語音交互的Echo。則“斷絕”了用戶返回到觸控操作的可能性的,這才讓人們終于開始正視智能語音交互本身。

另外一點關(guān)鍵是亞馬遜對于語音交互場景的深入理解——語音交互雖好,但是在公共場合比較吵的環(huán)境中并不適用,智能音箱就該成為小家電一般的存在,滲入人們的日常生活空間。為此,李志飛也向雷鋒網(wǎng)簡單也講述了出門問問曾在美國做過的相關(guān)調(diào)研:

我們曾采訪了大量亞馬遜Echo和Google Home的使用者,同時也對美國智能家居需求與中國用戶對智能家居的需求進行深度調(diào)研。在美國,由于智能家居生態(tài)比較完善,用戶對智能音箱可以便捷控制家居的需求尤其強烈。實際上,中國人也有著這樣的需求。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?國外咨詢公司Statista統(tǒng)計的Echo用戶具體使用情況

至此,人們終于整體感受到智能語音技術(shù)的“不同”,或者說是在體驗層面達到了“讓用戶買單,并且不后悔”的程度。

問題來了,智能音箱在外國這么火,為什么國內(nèi)卻遲遲發(fā)展不起來?

“落后”明顯的中國市場

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

雖然隔著太平洋,但是中國在3C電子產(chǎn)品消費市場上之前從未發(fā)生大的“脫節(jié)”,智能音箱卻是一個罕見的例子。一位國內(nèi)智能音箱從業(yè)者向雷鋒網(wǎng)透了個底:

而國內(nèi)智能音箱目前的產(chǎn)量和銷量還在千、萬之間浮動,賣得最好的還是京東的叮咚,但實際數(shù)量仍遠遠小于Echo。數(shù)量最多的還是很多小廠商生產(chǎn)的低劣的智能音箱產(chǎn)品,那種產(chǎn)品10句話中有2句話有反應(yīng)就不錯了。

那么究竟是什么原因?qū)е铝诉@樣的現(xiàn)象?打造智能音箱的技術(shù)基礎(chǔ)差異應(yīng)該是最主要的原因。對此出門問問CEO李志飛對雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))表示:

如果只是單單做一個演示(Demo)版的智能音箱是沒有門檻的,但如果做一款用戶體驗好,性價比高的智能音箱是存在很高門檻的。

比如產(chǎn)品需要不停迭代完善,以確保穩(wěn)定的網(wǎng)絡(luò)連接;比如一款精美的音箱需要反復(fù)磨合外觀設(shè)計;又比如語音交互需要良好的收聲效果,而揚聲器本身會發(fā)聲,在遠場喚醒智能音箱時,就需要消除揚聲器本身的聲音;甚至音量大時的震動也會影響收聲,所以音腔和麥克風(fēng)之間的距離都需要考量。

喜馬拉雅副總裁李海波在雷鋒網(wǎng)的采訪中也表達了類似的看法:

我們之前在打造自己的智能音箱的時候也花了不少時間。為了能正常使用,硬件部分足足微調(diào)了40天,音箱如何才能理解人類指令這件事花的時間就更久了,大概用了400多天,這還是應(yīng)用場景高度集中化的情況下。

這也從另外一個方面映射出智能音箱市場所存在的“分裂發(fā)展”問題:看起來簡單的智能音箱想要真正實現(xiàn)日常語音交互,實際上全是技術(shù)難題。也正是這些難題讓中國智能語音市場發(fā)展遲緩,而其中影響最大的就是機器對于中文的理解,也就是我們俗稱的NLP。

為了說明中文的NLP在智能音箱上面有多難,李海波給雷鋒網(wǎng)舉了一個例子:

我們曾經(jīng)統(tǒng)計過,一個簡單的‘下一曲’,用中文來表達就有60多種方式,而且這還是不考慮方言差異的前提下。

這也成為了智能音箱一個實打?qū)嵉钠琳希瑫r也是很多人對于BAT能夠加入到這場戰(zhàn)斗中感到高興的原因——這3家手中都有著大量可供機器學(xué)習(xí)的數(shù)據(jù),同時也有充足的人手和資源來支撐這個反復(fù)調(diào)試的過程。

另外一個層面來看,中國其實有很多人、公司已經(jīng)在智能語音的探索上先行一步,但是往往僅限于一些碎片化的問題,就像百度這次收購的KITT.AI一樣。利用自己其他業(yè)務(wù)線相對雄厚的資金收入來整合社會能力,反過來再將這些能力打包給消費者。這也是BAT自己所熟悉和擅長的事情。

雷鋒網(wǎng)總結(jié):人工智能“商業(yè)化ing”

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

人類歷史上曾經(jīng)出現(xiàn)無數(shù)種技術(shù)、發(fā)明,究竟人們什么時候才會認真對待它們呢?答:只要它們能夠給人類帶來大幅度的利益。

這條法則對于人工智能技術(shù)同樣適用,正如馬云之前曾經(jīng)公開表示的那樣:“AlphaGo 贏了,So TM What?”這句話雖然聽起來偏激,但從對于人類實際影響這個角度出發(fā),AlphaGo的確沒有留下足夠深的印記。

相反,看起來不起眼的智能音箱反倒有可能實現(xiàn)這個目標。

百度談開源、騰訊曬內(nèi)容體系、阿里想打造新消費入口,新入場的BAT雖然在方向策略上有所分歧,但有一點是確定的,他們都不會錯過首先實現(xiàn)人工智能商業(yè)化的目標。最好的證明就是三家發(fā)布智能音箱產(chǎn)品的場合。:百度AI開發(fā)者大會、騰訊“云+未來”技術(shù)峰會、阿里AI Labs人工智能實驗室對外公布。

拋開BAT中誰能成為最終贏家這個目前仍無法確定的終極問題不談,3家大力下注人工智能的舉動卻是再清晰不過的。統(tǒng)治了中國的“互聯(lián)網(wǎng)”時代的BAT,已經(jīng)充分意識到了人工智能將會帶來的趨勢和變革,才會如此“默契”地同時進入這個戰(zhàn)場。

短期來看,圍繞著智能語音和音樂、語音類內(nèi)容服務(wù)仍是主要的路線。其后智能音箱的市場爭奪將圍繞這各家的差異化展開,屆時擁有更多用戶和場景資源的騰訊或許會擁有一定的優(yōu)勢。而阿里的電商優(yōu)勢仍需要面對如何轉(zhuǎn)化的問題。至于百度嘛,還得看相關(guān)開源項目的進展情況。

當(dāng)然,這僅僅是個開始,人工智能的好戲還在后頭。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

這是BAT下半年的其中一個“戰(zhàn)場”。

2014年底,亞馬遜在官網(wǎng)悄悄地發(fā)布了Echo,但估計就連亞馬遜自己也沒想到,這個看上去“簡潔得有點簡陋”的奇怪音箱,居然能夠在日后賣出800多萬臺,不僅直接給亞馬遜帶來將近10億美元營收,甚至在Kindle之后成為又一款消費者所認可的終端。

Echo之后所代表的技術(shù)趨勢并不“隱晦”:智能語音技術(shù)落地點,全新交互方式,全新服務(wù)接口這種概念的分析早就被寫了幾百遍。但另外一邊卻是赤裸裸的現(xiàn)實——一貫緊跟全球消費電子市場的中國,在智能語音的具體商業(yè)化這件事上卻“落后”了。

好在,“落后”并不意味著錯過,反之因為“落后”,讓整個行業(yè)積聚了非常強大的力量,隨時有可能爆發(fā)出來。換句話說,2017年很可能會成為中國智能音箱市場最難得的“黃金發(fā)展期”。

兩個星期,BAT全部進入戰(zhàn)場

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

雖然這早已不是BAT在同一個領(lǐng)域中爭高下,但在兩周內(nèi)讓3家巨頭同時進入“戰(zhàn)場”,智能語音的魅力的確很大。第一個又動作的是騰訊,在兩周之前的騰訊云峰會上,騰訊云就發(fā)布了全新的智能語音產(chǎn)品“騰訊云小微”。

而小微主要包括了3個開放性的平臺:能夠通過SDK接入硬件的硬件開放平臺;包含騰訊各種自由內(nèi)容、應(yīng)用資源的Skill開放平臺;以及能夠讓機器不斷學(xué)習(xí)和決策的小微服務(wù)機器平臺。

智能音箱爆發(fā)倒計時,人工智能即將商業(yè)化?

有趣的是,在官方資料中,騰訊還提到了自己的一點優(yōu)勢,小微的所有能力來自于微信AI團隊。后者之前實際上已經(jīng)將語音識別、加入語義分析技術(shù)的語音輸入、語音轉(zhuǎn)文字、等功能添加到微信當(dāng)中。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-07-07
人工智能商業(yè)化來襲?智能音箱爆發(fā)進入倒計時
2014年底,亞馬遜在官網(wǎng)悄悄地發(fā)布了Echo,但估計就連亞馬遜自己也沒想到,這個看上去“簡潔得有點簡陋”的奇怪音箱,居然能夠在日后賣出800多萬臺,不僅直接給

長按掃碼 閱讀全文