《電器》雜志專訪捷通華聲:以語音交互為核心的AI技術(shù)如何助推家電智能化升級

《電器》雜志專訪捷通華聲:以語音交互為核心的AI技術(shù)如何助推家電智能化升級

物聯(lián)網(wǎng)時(shí)代,人工智能技術(shù)的融入尤其是語音交互技術(shù),給家庭交互、客廳娛樂等帶來無限可能。在當(dāng)下的智能家居行業(yè),語音基于其交互的自然性,被認(rèn)為是未來人與家居交互的主要入口路徑,業(yè)內(nèi)普遍認(rèn)為,“語音將成為入口連接各種服務(wù),構(gòu)建智家生態(tài)”。

捷通華聲憑借在人工智能領(lǐng)域多年的積累,依托托國內(nèi)首個(gè)全方位人工智能開放平臺——靈云平臺,結(jié)合國內(nèi)領(lǐng)先的靈云遠(yuǎn)場語音交互技術(shù),以及人臉識別、聲紋識別、指紋識別等技術(shù)全面賦能物聯(lián)網(wǎng),成功在智能電視、智能機(jī)頂盒、智能車載、智能音箱、智能機(jī)器人等眾多領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用。

同時(shí),行業(yè)解決方案已經(jīng)在業(yè)內(nèi)得到廣泛認(rèn)可,成功應(yīng)用于新松、棠棣、木爺?shù)葞资曳?wù)型機(jī)器人中,以及長安等眾多智能車載產(chǎn)品中,并與樂視、小米等眾多電視、空調(diào)家電廠商建立了合作。

近日,家電行業(yè)權(quán)威雜志——《電器》雜志對捷通華聲總經(jīng)理武衛(wèi)東進(jìn)行了專題訪談,主要探討了以語音交互技術(shù)為核心的人工智能技術(shù)如何推動智能家電發(fā)展,并對AI與家電未來的深度結(jié)合進(jìn)行了展望,以下為采訪整理稿。

請簡單介紹公司目前在人工智能領(lǐng)域的布局,尤其以語音識別、語音交互為技術(shù)核心的人工智能戰(zhàn)略。

通過構(gòu)建人工智能開放平臺的方式,深化行業(yè)應(yīng)用、聚集合作伙伴,進(jìn)而構(gòu)建人工智能產(chǎn)業(yè)生態(tài)是捷通華聲重要的戰(zhàn)略布局。捷通華聲在這方面很早就進(jìn)行了積極的探索,2011年,捷通華聲的靈云全方位人工智能開放平臺就面向產(chǎn)業(yè)全面開放,并以“云 + 端”方式,為產(chǎn)業(yè)界提供語音合成、自然語言理解、語音識別、麥克風(fēng)陣列、語音喚醒、手寫識別、光學(xué)字符識別、人臉識別、聲紋識別、指紋識別、數(shù)據(jù)挖掘、機(jī)器翻譯等全方位人工智能能力。通過將其積累的人工智能技術(shù)開放出來,捷通華聲積累了眾多的合作伙伴,并服務(wù)大量的行業(yè)客戶。

以全方位人工智能技術(shù)為基石,捷通華聲已經(jīng)構(gòu)建了完善的人工智能云服務(wù)和產(chǎn)品生態(tài)系統(tǒng),從公有云、私有云到行業(yè)解決方案,全面賦能各行各業(yè),努力實(shí)現(xiàn)“讓每一家企業(yè)都擁有人工智能,讓每個(gè)人都能享受到人工智能的方便與快捷”的人工智能戰(zhàn)略。

目前,靈云人工智能云服務(wù)及產(chǎn)品生態(tài)系統(tǒng)包括以下五大類:

靈云云服務(wù)平臺(AICloud),包含語音云、圖像云、鎮(zhèn)客服云、智能外呼云等智能方案云服務(wù)以及智能語音、智能圖像等全方位AI技術(shù)云服務(wù);

智能物聯(lián)網(wǎng)(AIoT),包含智能電視語音助手、智能音箱語音助手、智能車載輸入法等,致力于讓每個(gè)智能終端“能聽會說、能思考會判斷”;

全方位人工智能能力平臺(AICP),為企業(yè)提供包括靈云智能語音、智能圖像、智能語義、生物特征識別等全能力私有云能力平臺,客戶可以靈活挑選、組合AI技術(shù),實(shí)現(xiàn)企業(yè)業(yè)務(wù)、應(yīng)用的智能化升級;

人工智能聯(lián)絡(luò)中心(AICC),包含全渠道智能客服系統(tǒng)、智能外呼系統(tǒng)、智能語音分析系統(tǒng)等在內(nèi)的,面向智能客戶服務(wù)中心的全方位人工智能門戶解決方案;

行業(yè)智能解決方案(AIIS),包括應(yīng)用于會議、司法、醫(yī)療領(lǐng)域的智能語音轉(zhuǎn)錄系統(tǒng),支持文本、名片、票據(jù)、證照識別的智能圖像識別系統(tǒng),以及可對人臉、聲紋等身份信息進(jìn)行綜合認(rèn)證的多維生物特征識別系統(tǒng)等。

在您看來人工智能目前處在怎樣的發(fā)展階段和什么樣的歷史位置?

目前,人工智能已經(jīng)處在了從技術(shù)快速發(fā)展到技術(shù)落地應(yīng)用的階段。例如經(jīng)過十幾年的發(fā)展,語音識別技術(shù)進(jìn)入到自由說的狀態(tài):當(dāng)人自然說話、自然表達(dá)時(shí)能夠準(zhǔn)確識別,這推動語音識別進(jìn)入到實(shí)現(xiàn)應(yīng)用的階段。捷通華聲將先進(jìn)的語音交互技術(shù)成功應(yīng)用與智能客服、智能外呼機(jī)器人、智能電視語音助手等產(chǎn)品上就是典型案例。

但除卻語音和計(jì)算機(jī)視覺領(lǐng)域,人工智能技術(shù)在其它領(lǐng)域的“落地”卻并不盡如人意,拿不出一份接地氣的商業(yè)落地成績單。很多人工智能技術(shù)開發(fā)者技術(shù)很強(qiáng),但面對復(fù)雜的商業(yè)應(yīng)用場景時(shí)便顯得有些捉襟見肘。“人工智能+行業(yè)”是人工智能落地的基礎(chǔ),它只有像水滴一樣滲透到實(shí)體經(jīng)濟(jì)中,滲透到各個(gè)行業(yè)中,才能帶來價(jià)值。

如今人工智能已如當(dāng)年的互聯(lián)網(wǎng)一樣,成為整個(gè)時(shí)代的引領(lǐng)者,其應(yīng)用落地也會對各行各業(yè)帶來深遠(yuǎn)影響。在未來的發(fā)展中,人工智能技術(shù)的發(fā)展還會有起伏,但不會再出現(xiàn)大的波瀾,它已然成為一項(xiàng)實(shí)用的技術(shù),正在各個(gè)領(lǐng)域進(jìn)入實(shí)用階段,必然會對未來帶來巨大變革。

就AI技術(shù)的發(fā)展而言,目前和家電產(chǎn)品是怎么結(jié)合的?能給家電行業(yè)帶來哪些變化?

目前在家電產(chǎn)品上應(yīng)用最廣泛的還是語音交互相關(guān)的AI技術(shù),通過使用語音識別、語音合成、語義理解等技術(shù),使家庭中靜止的家居轉(zhuǎn)變?yōu)槟苈牽烧f會思考的智能設(shè)備,用戶通過簡單的語音交互便能實(shí)現(xiàn)家居設(shè)備的控制。

AI技術(shù)的發(fā)展,其實(shí)改變了傳統(tǒng)的以遙控器或手機(jī)APP進(jìn)行人機(jī)交互的方式,給家電行業(yè)注入了新動能,并促使著整個(gè)家電行業(yè)進(jìn)行轉(zhuǎn)型升級,以更加智能化、便捷化、人性化的方式為消費(fèi)者提供服務(wù)。

《電器》雜志專訪捷通華聲:以語音交互為核心的AI技術(shù)如何助推家電智能化升級

在諸多有可能被AI技術(shù)顛覆的領(lǐng)域中,家電是否有被AI賦能的需求?貴公司又是如何給家電行業(yè)帶來變化和發(fā)展?

這個(gè)需求是肯定的,特別是物聯(lián)網(wǎng)技術(shù)的發(fā)展,我們正在進(jìn)入到一個(gè)萬物互聯(lián)互通的時(shí)代。而與我們息息相關(guān)的家電等設(shè)備,作為一個(gè)個(gè)獨(dú)立的終端,由于傳統(tǒng)交互方式及功能的單一,亟需通過AI賦能來提升用戶體驗(yàn)并提供額外的增值服務(wù)。

目前捷通華聲已經(jīng)在和各大家電廠商合作,通過輸出ASR(語音識別)、TTS(語音合成)、NLU(語義理解)等核心能力,為家電廠商提供產(chǎn)品智能化升級的技術(shù)保障。

提供核心技術(shù)的同時(shí),捷通華聲也打造了智能電視語音助手、遠(yuǎn)場機(jī)頂盒語音助手、智能音箱語音助手等各類語音交互產(chǎn)品,從核心技術(shù)到應(yīng)用產(chǎn)品全面賦能,從而實(shí)現(xiàn)讓每個(gè)智能終端“能聽會說、能思考會判斷”。

站在貴公司的角度,如何推動人工智能家電的發(fā)展?能為家電企業(yè)提供怎么樣的技術(shù)與解決方案?

捷通華聲擁有語音識別、語音合成、語義理解、麥克風(fēng)陣列技術(shù)、圖像識別、人臉識別、聲紋識別等12項(xiàng)人工智能核心技術(shù),并在2011年率先推出了全球首個(gè)全方位人工智能開放平臺——靈云平臺,30多種人工智能技術(shù)SDK全部免費(fèi)下載使用,為各行各業(yè)進(jìn)行AI賦能。針對家電企業(yè),我們除了提供我們的語音、語義、人臉識別、聲紋識別相關(guān)的AI技術(shù)外,我們還提供智能機(jī)頂盒、智能音箱、智能家居等一整套的語音交互解決方案,并且已經(jīng)在一些項(xiàng)目中成功落地。

靈云智能終端解決方案的一大優(yōu)勢就是適應(yīng)性強(qiáng)、可復(fù)制性強(qiáng),可根據(jù)客戶需要在不同設(shè)備中實(shí)現(xiàn)助手級的語音交互能力。例如靈云電視語音助手可快速嵌入到電視、機(jī)頂盒、廣電盒子等設(shè)備中,通過藍(lán)牙遙控器直接語音控制電視,或利用麥克陣列,直接與電視對話,輕松實(shí)現(xiàn)語音搜索、設(shè)備控制、天氣查詢等功能。助手級解決方案同樣可以應(yīng)用于機(jī)頂盒廠商、OTT盒子、IPTV盒子等電視盒子中,讓盒子也能快速擁有語音交互能力。

《電器》雜志專訪捷通華聲:以語音交互為核心的AI技術(shù)如何助推家電智能化升級

貴公司目前是否和家電企業(yè)建立合作,哪些家電品類對AI技術(shù)需求更迫切?您認(rèn)為哪些家電需要AI技術(shù)的加持和賦能。

捷通華聲一直和家電企業(yè)保持有密切合作,在家電品類上,例如電視、冰箱、空調(diào)等大家電及微波爐、燈具、掃地機(jī)器人等小家電都有智能化升級的需求和必要,通過結(jié)合語音識別、圖像識別等AI技術(shù),賦予家電新的交互方式,例如可以邊看電視邊通過圖像識別下單購物,空調(diào)可以根據(jù)室內(nèi)溫度及用戶習(xí)慣自動調(diào)節(jié),冰箱可以根據(jù)已有食材為你搭配菜譜等等,總之,有了AI技術(shù)的加持,家電會變得越來越“懂你”。

在AI技術(shù)具體落地方面,主要有哪些?是大數(shù)據(jù)的分析、云計(jì)算,還是主要指交互方式的變化?

這幾方面應(yīng)該都有。AI技術(shù)的發(fā)展一方面的確會改變傳統(tǒng)的交互方式,比如傳統(tǒng)家電的按鍵到遙控器模式,再到手機(jī)APP控制形式,再到最近比較流行的語音交互形式,將來還可能會出現(xiàn)腦電波控制家電的場景;另一方面,通過與大數(shù)據(jù)、云計(jì)算技術(shù)的結(jié)合,人工智能還能夠根據(jù)用戶行為歸納預(yù)測并智能推薦個(gè)性化服務(wù),例如,冰箱的雞蛋快吃完時(shí),它能夠主動發(fā)出提醒并完成下單;每天回家前一個(gè)小時(shí),空調(diào)就會自動啟動,并調(diào)至主人習(xí)慣的溫度等等。

AI技術(shù)在實(shí)現(xiàn)過程中的難點(diǎn)主要是哪個(gè)方面?

AI技術(shù)的發(fā)展其實(shí)是螺旋上升的一個(gè)過程,它并不完美,想要達(dá)到人們期望的效果其實(shí)是有一定難度的,一些人類簡單的操作如看和聽,對于機(jī)器來說并不容易,而且讓機(jī)器能夠像人類一樣思考更是難上加難,這也是AI技術(shù)在實(shí)際落地中面臨的最大挑戰(zhàn)。

目前來看,您如何看待,人工智能對家電的影響主要體現(xiàn)在交互方式的變化,語音、圖像以及手勢識別?未來還會有哪些變化?除了交互方式,還有哪些是AI能帶給家電的?

目前,人工智能主要改變的是家電的交互方式,用戶通過語音、圖像、手勢等操作方式更自然地與設(shè)備進(jìn)行交互,但這其實(shí)仍然依賴人去操控,而未來智能家電會根據(jù)用戶行為分析,主動去提供一些個(gè)性化服務(wù)。

除了交互方式外,AI將來甚至?xí)淖兗译姷男螒B(tài),例如電視機(jī)將不會再有實(shí)體設(shè)備,而是一個(gè)虛擬的立體投影,除了看電視,還兼具家庭管家、視頻聊天、智能陪護(hù)等功能

在交互方式變化的背后,有哪些革命性技術(shù)?作為人工智能技術(shù)解決方案商,貴公司能給家電企業(yè)帶來什么?

交互方式的改變,離不開語音識別、語義理解、圖像識別等人工智能核心技術(shù),而這些技術(shù)的發(fā)展其實(shí)離不開深度學(xué)習(xí)技術(shù)所帶來的革命性突破。捷通華聲依托與清華大學(xué)建立戰(zhàn)略合作,擁有一大批人工智能的核心算法研究團(tuán)隊(duì),目前公司所推出的12項(xiàng)人工智能技術(shù)均為捷通華聲完全自主知識產(chǎn)權(quán),全方位的開放平臺為家電企業(yè)變革創(chuàng)新帶來了新的契機(jī)。

伴隨全屋智能發(fā)展起來的還有智能音箱這一新品類,您認(rèn)為在未來智能音箱在AI鏈條中的地位是怎樣的?

智能音箱其實(shí)目前更多是起到一個(gè)教育用戶認(rèn)知人工智能的作用,相較于國外流行的音樂文化,國內(nèi)的大多數(shù)用戶并沒有在家庭中使用音箱(或音響)的習(xí)慣,而目前智能音箱的火爆,其實(shí)是人們對語音交互及智能問答等功能的好奇“嘗鮮”,而在未來,智能音箱很可能會演變?yōu)榧彝サ闹悄苷Z音助手,但是,無論未來語音助手演化成何種形態(tài),都不會僅僅局限于現(xiàn)有的音箱模式之中。

目前AI交互技術(shù)存在的問題是哪些?不完美的地方有哪些?距離真正的智能還有多遠(yuǎn)?

AI技術(shù)存在的問題是目前并不完美,離人們的期望還存在一定差距。例如人臉識別、聲紋識別等身份認(rèn)證技術(shù),雖然已經(jīng)達(dá)到了很高的識別準(zhǔn)確率,但由于應(yīng)用場景的特殊性,千萬分之一的錯(cuò)誤都可能帶來嚴(yán)重的后果。

另外由于目前NLU技術(shù)(語義理解)的發(fā)展瓶頸,市面上大多數(shù)的智能化產(chǎn)品其實(shí)并不太智能,依然需要人為主動地進(jìn)行操控??傊嚯x真正的智能還有很遠(yuǎn)的路要走。

您能描述一下,AI家電的使用場景和終極發(fā)展階段的樣貌。

在未來,所有的家電將會互聯(lián)互通,除了與人交互外,設(shè)備間也能進(jìn)行“溝通”,家電通過學(xué)習(xí)用戶行為,能夠在無感知無指令的情況下為人們提供適時(shí)適宜的服務(wù)并且不會產(chǎn)生打擾。另外,家電設(shè)備的形態(tài)也可能會發(fā)生變化,人們將會體驗(yàn)到真正智能化、便捷化、人性化的家居服務(wù)。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-06-20
《電器》雜志專訪捷通華聲:以語音交互為核心的AI技術(shù)如何助推家電智能化升級
物聯(lián)網(wǎng)時(shí)代,人工智能技術(shù)的融入尤其是語音交互技術(shù),給家庭交互、客廳娛樂等帶來無限可能。

長按掃碼 閱讀全文