業(yè)內首創(chuàng)“多模態(tài)喚醒”:天貓精靈發(fā)布全新人機交互系統(tǒng)

在2020云棲大會上,天貓精靈發(fā)布了首個全場景人機交互系統(tǒng)AliGenie5.0,將視覺、語音、觸覺等多種形態(tài)的交互方式融合在一起,能更精準地感知物理世界,深入理解使用者的意圖。當天發(fā)布的三款新產品也全部搭載了AliGenie5.0,提供了唇動喚醒、揮手喚醒等多種“擬人化”的喚醒方式。

天貓精靈事業(yè)部總經理庫偉表示,從AliGenie5.0開始,天貓精靈將開始以服務為中心,應用微內核、多模態(tài)交互等技術,構建全場景智能化。據悉,該系統(tǒng)同步面向開發(fā)者、智能家居合作伙伴開放。此前,多模態(tài)交互技術多停留在學術層面,阿里是業(yè)內首個把“多模態(tài)喚醒”技術大規(guī)模應用在消費電子產品上的公司。

天貓精靈事業(yè)部總經理庫偉介紹搭載“唇動喚醒”黑科技的全新系統(tǒng)

AliGenie5.0是天貓精靈開發(fā)的多模態(tài)人機交互系統(tǒng),首次將唇動、手勢、語音語義等多種形態(tài)的信息輸入融合在一起,可通過多模態(tài)感知的方式理解人類的交流意圖,并直接給出反饋。同時支持分布式的微內核操作系統(tǒng),能夠覆蓋更廣闊的的應用場景。此外,AliGenie5.0還支持“云應用”技術,能夠突破硬件的配置和性能限制,跨平臺、跨終端,流暢使用Windows、Linux、Android等系統(tǒng)的豐富應用,用戶甚至可以在天貓精靈上玩電腦游戲、上網課、體驗3D渲染等。

目前,這一系統(tǒng)已率先應用在此次發(fā)布的三款新品上,使天貓精靈具備了自然喚醒的能力。例如,用戶在音箱端開啟設置“自然喚醒”后,在1米左右的距離下,當機器識別到有人開始盯著它說話時,不用再喊出喚醒詞,就能直接自然對話。

全場景、多模態(tài)人機交互系統(tǒng)AliGenie5.0

天貓精靈此次發(fā)布的三款新品分別為配備了10吋智能屏及大容量電池的天貓精靈CC10電池版、4吋智能屏產品天貓精靈CC MINI,以及第二代IN糖,上述新品全部搭載全新的AliGenie5.0系統(tǒng)。其中,CC MINI還集成了阿里自研的微內核操作系統(tǒng),也是全球首個搭載微內核系統(tǒng)的智能音箱,能夠在小屏的產品上實現觸屏交互,把追求高效生活常用的鬧鐘、日程、家居控制等功能進行整合,開發(fā)了晨起、睡眠等核心場景的極簡模式,讓生活中的微小需求也能被智能化。

寶馬集團攜手天貓精靈探索車家互聯(lián)技術,并推出MINI 聯(lián)合定制版

據悉,這一系統(tǒng)很快也將面向天貓精靈的合作伙伴開放,今年內會陸續(xù)支持汽車、房產、智能健康、兒童教育等領域的聯(lián)合定制產品,覆蓋80多個終端品類。未來在生態(tài)內的智能場景中,天貓精靈的用戶只要使用同一個賬號登錄,就可以進入個人界面,無差別的使用智能助手。

庫偉表示,智能終端的設備量正處于快速爆發(fā)期,隨身穿戴、車載、智能家居、智慧社區(qū)、酒店、養(yǎng)老院等需要終端設備來服務消費者的領域,都將逐步被智能化改造。他認為,智能音箱的形態(tài),已經完成了“AI智能助手”第一階段的市場普及,未來將出現更多具備多種交互形態(tài)、提供AI助手能力的產品形態(tài),天貓精靈也正在研發(fā)具備視覺交互、語音交互甚至行動能力的全場景智能設備。“當智能場景越來越繁雜時,就需要一個可動態(tài)適配所有場景的人機交互系統(tǒng),來確保消費者體驗的一致性,AliGenie也將不斷升級,為機器賦予認知、理解和行動力,讓每個人、每個家庭都擁有一個專屬的智能助手?!?/p>

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2020-09-20
業(yè)內首創(chuàng)“多模態(tài)喚醒”:天貓精靈發(fā)布全新人機交互系統(tǒng)
在2020云棲大會上,天貓精靈發(fā)布了首個全場景人機交互系統(tǒng)AliGenie5.0,將視覺、語音、觸覺等多種形態(tài)的交互方式融合在一起,能更精準地感知物理世界,深入理解使用者的意圖。

長按掃碼 閱讀全文