所謂“模態(tài)”,英文是modality,用通俗的話說,就是“感官”,多模態(tài)即將多種感官融合。
目前的人機智能交互比如語言控制不如屏幕控制那么精準(zhǔn),很多時候會誤判指令和錯誤喚醒,比較語言充滿了不確定性;再比如,語音交互的物聯(lián)網(wǎng)設(shè)備還是缺乏主動服務(wù)的能力,只是換了操作方式而已,用戶體驗沒有本質(zhì)提升。
假如我們把“模態(tài)”通俗地理解為感官,那么智能音箱就是只具備聽覺模態(tài)的物聯(lián)網(wǎng)設(shè)備,而加載AI分析能力的攝像頭可以視為視覺模態(tài)的物聯(lián)網(wǎng)設(shè)備。把聽覺、視覺甚至更多模態(tài)組合到一起,多模態(tài)物聯(lián)網(wǎng)也就誕生了。
目前的AI設(shè)備中感知模態(tài)主要包括三種。第1種是、語音交互,包括語音指令控制、語義理解、多輪對話、NLP、語音精準(zhǔn)識別等領(lǐng)域;第2種叫做機器視覺,包括自然物體識別、人臉識別、肢體動作識別等;第3種則是傳感器智能,包括AI對熱量、紅外捕捉信號、空間信號的閱讀與理解。
把這三種東西融合在一起,物聯(lián)網(wǎng)設(shè)備就可以在單純的能聽會說之外,同時還用攝像頭觀察、用傳感器判斷。而比較前沿的多模態(tài)感知還包括機器嗅覺,機器觸覺和情緒理解等內(nèi)容,但目前還沒有落地產(chǎn)品。
目前多模態(tài)交互的主要應(yīng)用場景:
場景一:多模態(tài)AI交互技術(shù)投射在物聯(lián)網(wǎng)設(shè)備上,大概就是用機器視覺技術(shù)進行嘴唇識別,來分離語音交互指令。嘗試通過用機器視覺來讀取說話人的唇語和動作,來判斷每個聲音指令的來源。
場景二:多模態(tài)空調(diào)。在一些新的智能空調(diào)解決方案中,空調(diào)會在語音交互的基礎(chǔ)上通過機器視覺來判斷用戶的位置,提供智能送冷,并且會結(jié)合傳感器判斷屋內(nèi)溫度和濕度,提供更精準(zhǔn)的環(huán)境方案。
場景三:多模態(tài)電視。今年電視背后的AI平臺戰(zhàn)打得風(fēng)生水起,把機器視覺技術(shù)引入電視成為了新的趨勢。通過機器視覺來讓電視觀察屋內(nèi)照明情況、用戶與電視的距離,電視可以主動調(diào)節(jié)屏幕光線強度,輸出比較護眼的模式。還有的AI應(yīng)用是讓電視在觀察到兒童看電視后主動開啟童鎖。
據(jù)媒體報道, 2019年年底國產(chǎn)芯片核心玩家炬芯科技隆重舉辦了TechLife開發(fā)者大會,以“多模態(tài)交互技術(shù)”為主題,在人工智能的大背景下探討多模態(tài)交互技術(shù)的落地和發(fā)展,同時還邀請了阿里達摩院、喜馬拉雅、玩瞳科技、CEVA 等多位技術(shù)大咖,共同探討行業(yè)前沿技術(shù),現(xiàn)場人氣爆棚,可見炬芯科技對未來趨勢有著獨特的預(yù)見性,這也是多年來行業(yè)領(lǐng)先致勝競品的重要原因之一。
人機交互正在從鍵盤鼠標(biāo)的交互轉(zhuǎn)變成語音視覺等多模態(tài)交互。交互門檻的不斷降低,給交互體驗帶來了明顯提升。
為實現(xiàn)更優(yōu)質(zhì)交互體驗,炬芯作為一家芯片設(shè)計廠商的也在持續(xù)深耕技術(shù),希望用更優(yōu)質(zhì)產(chǎn)品給智能機器賦能。炬芯推出 ATS 3607、 ATS 3607D、 ATS 3609、 ATS 3609D 四款多模態(tài)智能交互芯片,充足的算力、超低的功耗、強大的可擴展性,將賦予機器更多的可能性。
其中,炬芯 ATS 3609D,多麥智能語音、輕智能圖像、雙模態(tài)識別手指輸入解決方案。將語音交互、機器視覺和傳感器三個模態(tài)綜合,為強人工智能下的多模態(tài)交互提供可行解決方案。
AI 多模態(tài)交互技術(shù)已經(jīng)成為人工智能交互的必然趨勢,我們也期待著炬芯多模態(tài)交互芯片平臺能在更多的場景中應(yīng)用開來,賦予機器更強的智能屬性,用更加像人的智能機器給大家?guī)砀玫姆?wù)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 螞蟻集團架構(gòu)大調(diào)整:CTO線變革引領(lǐng)技術(shù)新潮流
- 蔚來智能駕駛重大調(diào)整:組織架構(gòu)重組,從"半成品"到"端到端"解決方案革新
- 滴滴致歉“臭車”事件,日產(chǎn)本田合并談判引關(guān)注,新車市波瀾再起
- 三星助力國內(nèi)手機廠商爭奪高端市場,競爭升級,誰將脫穎而出?
- 美團騎手過度疲勞工作?強制下線跑單超時者,保障騎手健康與安全
- 王自如離職風(fēng)波揭開真相:董明珠批緋聞無聊,職場風(fēng)波需理性對待
- 2024車市冷靜觀察:十大熱門車型背后的真實故事
- 中國云服務(wù)市場風(fēng)起云涌:阿里云、華為云、騰訊云三強爭霸,市場份額七成誰主沉浮
- 微信小店“送禮物”功能全面推進:騰訊回應(yīng):逐步灰度測試中,小心謹(jǐn)慎不冒進
- 雷諾集團權(quán)衡日產(chǎn)與本田合并:利益最大化需謹(jǐn)慎抉擇
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。