7月4日- 5日,2018百度AI開發(fā)者大會在北京國家會議中心隆重舉行,大會上展示了眾多落地化成果。此次大會上百度首次舉辦AI設(shè)計論壇,百度設(shè)計體驗(yàn)委員會主席、百度人工智能交互設(shè)計院院長、百度用戶體驗(yàn)中心總經(jīng)理關(guān)岱松及設(shè)計團(tuán)隊(duì)分享了百度在AI設(shè)計和用戶體驗(yàn)方面的經(jīng)驗(yàn)及思考,共同交流AI智能美學(xué)及創(chuàng)意等方面的最前沿發(fā)展。論壇上百度與湖南大學(xué)的戰(zhàn)略合作正式啟動,整合百度在AI交互設(shè)計領(lǐng)域的優(yōu)勢和湖南大學(xué)先進(jìn)的科研能力,雙方將共建聯(lián)合創(chuàng)新實(shí)驗(yàn)室及博士后基地,在AI設(shè)計領(lǐng)域進(jìn)行更多更有價值的合作與探索。
百度人工智能交互設(shè)計院自成立以來,圍繞智能語音交互界面設(shè)計節(jié)點(diǎn)開展了大量人因工程實(shí)驗(yàn),分享了一系列的研究結(jié)論,這些結(jié)論已經(jīng)被寫入DuerOS的設(shè)備準(zhǔn)出準(zhǔn)入規(guī)范和設(shè)計指導(dǎo)原則之中,幫助DuerOS和開發(fā)者打造更符合人的需求和習(xí)慣的語音交互流程。進(jìn)入人機(jī)交互研究的2.0階段,百度人工智能交互設(shè)計院分享了他們在外觀、自然交互、情感交互等領(lǐng)域的前沿探索案例,將AI時代做研究的方法升級,打造類人交互的智能體。
以下為演講實(shí)錄:
大家好,我是百度AI交互設(shè)計院的研究員李璇,去年11月百度成立了行業(yè)內(nèi)第一個交互設(shè)計研究機(jī)構(gòu),很高興借此機(jī)會跟大家分享我們的研究成果。面對AI時代為人機(jī)交互帶來的巨大變化,如何通過研究引領(lǐng)交互設(shè)計,這是我們持續(xù)在探索的問題,而我們找到的答案,是人因工程。
什么是人因工程?通俗地說就是我們做設(shè)計,要把人知道的、不知道的自己,以做工程的思維,精準(zhǔn)、量化、全面地研究得透透的,然后運(yùn)用給到設(shè)計中。
人因工程不是一個全新的領(lǐng)域。在工業(yè)時代,人使用機(jī)器來提高生產(chǎn)效率,人機(jī)互動是純物理的機(jī)械互動,人因工程研究的是人生理各方面的閾限,基于這些閾限做出在人可以承受的范圍內(nèi)效率最大化的設(shè)計。
在信息時代,人使用機(jī)器的替代一部分的認(rèn)知勞動,人機(jī)互動是虛擬的認(rèn)知交流,人因工程研究人的認(rèn)知規(guī)律,來優(yōu)化信息傳遞。
過去,人因工程奠定了對人體特征、認(rèn)知規(guī)律進(jìn)行研究和并運(yùn)用于設(shè)計的基礎(chǔ),到了AI時代,因?yàn)槿藱C(jī)交互方式和關(guān)系的變化,人因工程又有了新的延伸。
首先,AI技術(shù)讓機(jī)器越來越像人,機(jī)器可以通過語音、手勢、眼神等人類最自然的方式與人進(jìn)行交流,甚至開始被賦予人的外形。人類不再需要去適應(yīng)機(jī)器,而是機(jī)器適應(yīng)人。其次,AI技術(shù)讓機(jī)器越來越懂人,機(jī)器不僅懂我們的語言、肢體,甚至懂我們的動機(jī)、文化。此外,當(dāng)機(jī)器越來越像人的時候,人機(jī)關(guān)系也會發(fā)生變化。人們過去對機(jī)器是冷冰冰的,但現(xiàn)在會將越來越多對人的情感、需求和預(yù)期都投射到機(jī)器上,機(jī)器帶給人的體驗(yàn)變得更加復(fù)雜。
所以,AI時代的人因工程,將不僅僅關(guān)乎人的能力、行為、限制和特點(diǎn),也關(guān)乎社會、文化和心理,是真正以人類為中心的系統(tǒng)工程。那么在這樣的方法論和研究范疇中,我們具體在怎么做呢?
1.0將智能語音作為新交互方式,定義語音交互標(biāo)準(zhǔn)
對于人來說,語音對話是最自然、最高效的交流方式,語音交互是AI時代新交互形態(tài)的開端,但其實(shí)整個行業(yè)對語音交互設(shè)計還有很多疑問,為此,定義語音交互的體驗(yàn)標(biāo)準(zhǔn)是我們工作的開始。
首先,我們梳理出五個節(jié)點(diǎn),通過喚醒、響應(yīng)、輸入、理解、輸出,人和機(jī)器完成每一次的語音對話,為了打造好的語音對話體驗(yàn),每一個節(jié)點(diǎn)都會對應(yīng)很多設(shè)計要點(diǎn)需要被研究和定義。我們系統(tǒng)地梳理每個節(jié)點(diǎn)下的設(shè)計要點(diǎn),并在這個框架下去逐步開展精細(xì)的實(shí)驗(yàn),以確定最優(yōu)的機(jī)器參數(shù)和反饋水平。比如從聲學(xué)角度,研究了什么樣的聲音好聽、怎么樣的喚醒詞好發(fā)音;從語言學(xué)角度,研究機(jī)器和人對話,什么樣的話術(shù)好;從視覺認(rèn)知角度,研究不同距離下的字號顯示……最終我們輸出了一系列的研究結(jié)論,并應(yīng)用到了DuerOS的設(shè)備準(zhǔn)出準(zhǔn)入規(guī)范和設(shè)計指導(dǎo)原則之中,幫助DuerOS和開發(fā)者們打造更符合人的需求和習(xí)慣的語音交互流程。
2.0打造類人交互的智能體
在完成了對大部分語音交互節(jié)點(diǎn)的研究后,我們開始更加深入地去思考如何在此基礎(chǔ)上,讓人機(jī)交互更加類人,讓人在面對AI產(chǎn)品的時候更加感知到它是一個智能體而不僅僅是機(jī)器。圍繞這一點(diǎn),在這里想跟大家分享我們認(rèn)為在不久的未來比較重要的三個方面。
外觀
首先,我們認(rèn)為作為一個智能體,外觀很重要,它影響著人對AI產(chǎn)品的第一印象和預(yù)期。圍繞外觀,可研究的問題有很多,而經(jīng)常被爭論的一個問題是,智能產(chǎn)品是否應(yīng)該像人及多大程度上像人,即擬人度的問題,分享一點(diǎn)我們的研究。
我們將擬人度分為面部擬人和全身擬人進(jìn)行拆解,然后通過實(shí)驗(yàn)去研究用戶對不同擬人度的認(rèn)知和喜好度,得到了一些有趣的結(jié)果。
比如在臉部造型上,兩個眼睛或兩個眼睛加鼻子的五官設(shè)計是相對比較保險的,增加嘴巴容易形成兩極分化,說非常喜歡和非常不喜歡的比例都會增高,所以如果我們要進(jìn)行擬人的臉部設(shè)計,對是否要“嘴巴”需要慎重。在全身擬人的設(shè)計上,“手”是一個關(guān)鍵部位,如果想要進(jìn)行全身的擬人,最好將手帶上。
這只是探討外觀的其中一項(xiàng)研究,我們還研究智能產(chǎn)品的設(shè)計風(fēng)格、材質(zhì)、尺寸、形狀等等,并探得了人們對于不同智能產(chǎn)品的外觀的認(rèn)知要點(diǎn)和心理原型。
自然交互
在當(dāng)下語音交互體驗(yàn)持續(xù)優(yōu)化的基礎(chǔ)上,我們認(rèn)為走向自然交互是人機(jī)交互方式的發(fā)展趨勢。所謂的自然交互是以人為中心,參照人類信息輸入輸出通道的交互方式。人類通過視、聽、觸、味、嗅接收信息,通過文字、語音、肢體、眼神、表情等來進(jìn)行表達(dá)。
在人的信息接收方面,視覺和聽覺能夠滿足90%以上的信息需求。所以,機(jī)器在自然交互中的信息輸出,最重要的是解決如何有效的讓視覺和聽覺信息相互配合的問題。在這個方面,我們借助眼動儀對用戶視覺資源分配情況進(jìn)行了量化研究,衡量了不同設(shè)計方案中視聽信息的配合情況。
在人的信息表達(dá)方面,語言結(jié)合肢體,尤其手勢是人類最常見、也最自然的表達(dá)方式。雖然人們在生活中經(jīng)常使用手勢,但如何將人類自然手勢轉(zhuǎn)化為人機(jī)交互語言,目前沒有成熟的交互方案,大家都還沒有經(jīng)驗(yàn)。
我們邀請用戶來到實(shí)驗(yàn)室,去觀察要實(shí)現(xiàn)各種操作時,用戶最自然的手勢反應(yīng)。我們得到了近800個手勢,根據(jù)通用性和可理解性進(jìn)行篩選,形成一套最優(yōu)手勢集。然后,借助綠野仙蹤的方法,也就是通過后臺人為操作來實(shí)現(xiàn)的用戶體驗(yàn)手勢交互效果,我們讓用戶擺脫遙控器,用語音和手勢來操控設(shè)備,借助腦電、肌電等技術(shù)對操作過程中的情感體驗(yàn)、心理負(fù)荷及操作疲勞進(jìn)行測量,我們?nèi)ズ饬拷换ゲ僮鞅澈蟮淖匀惑w驗(yàn),最終篩選出在不同情境和操作下手勢和語音配合最優(yōu)的設(shè)計方案,也應(yīng)用到了DUEROS的設(shè)計中。
對于自然交互,我們還會去探討更多的感知覺通道,來完善自然交互的設(shè)計。語音交互還是自然交互,對于機(jī)器來說都是交互通道的問題,觸碰的是人的感知覺。而繼續(xù)進(jìn)化的下一步,我們認(rèn)為是情感交互。這將是一個很大的飛越,它讓機(jī)器可以觸碰人的內(nèi)心。
情感交互
情感交互是讓機(jī)器具有類似人一樣觀察、理解和表達(dá)情緒的能力,而要做到這一點(diǎn),機(jī)器需要對人情緒進(jìn)行準(zhǔn)確地識別和合理的應(yīng)對。
人與人進(jìn)行交流時,通過表情、內(nèi)容、語氣語調(diào)、肢體四個通道來表達(dá)和接受情緒情感。達(dá)爾文說過,能夠從表情中識別情緒從而對對方的行為作出預(yù)判,是動物得以生存進(jìn)化的重要技能。為此表情無疑是最主要也最被廣泛研究的,讓機(jī)器識別人類情緒的重要課題,我們正在進(jìn)行這方面的研究。
在情緒應(yīng)對方面,我們研究高情商的人怎么應(yīng)對憤怒、挫敗等負(fù)面情緒,研究咨詢師怎么開導(dǎo)痛哭流涕的來訪者,研究好朋友和陌生人在表達(dá)關(guān)心時候的差別,從中提取好的應(yīng)對策略賦予機(jī)器。為了驗(yàn)證這些應(yīng)對策略,我們在實(shí)驗(yàn)中通過VR模擬場景誘發(fā)用戶的情緒,然后讓AI去平復(fù)。關(guān)于情緒識別和應(yīng)對的研究,也應(yīng)用到了機(jī)器人的交互設(shè)計之中,期待未來跟大家分享更多。
最后,作為專注于研究的團(tuán)隊(duì),我們還想分享在面對這些全新領(lǐng)域時,研究方法上的一些心得。
第一,因?yàn)檠芯款I(lǐng)域越來越前沿,我們需要在研究中去創(chuàng)造體驗(yàn)交互和場景。
第二,由于我們追求的是更加多元、立體的體驗(yàn),我們需要越來越多的引入生理測量來度量交互體驗(yàn),目前腦電、肌電和眼動是相對成熟的工具。
第三,人臉、聲紋、語氣等識別技術(shù)幫助我們獲得大量隱藏在行為背后的數(shù)據(jù),如用戶的情緒、需求、動機(jī)等,而大數(shù)據(jù)的運(yùn)算幫助我們構(gòu)建常模。
過去我們?yōu)榛A(chǔ)語音交互定義標(biāo)準(zhǔn),未來我們將投入更多的精力去打造能夠進(jìn)行自然交互、情感交互的智能體。
而基于心理學(xué)對人的構(gòu)建,認(rèn)知、情感和意志,所以在更超前的地方,我們還可以研究探討如何賦予機(jī)器意志、讓他可以有目的、有動機(jī)地進(jìn)行主動交互,以及在類人互動下的人機(jī)關(guān)系,甚至人和機(jī)器兩個物種之間的倫理問題。
未來的路還很長,百度AI交互設(shè)計愿意與大家進(jìn)行持續(xù)的交流和探討,一起成為AI交互設(shè)計領(lǐng)域的開路者和探路者。謝謝大家!
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。