在對話中理解蘇大強們:語音交互的未來會是老齡化+個性化嗎?

原標題:在對話中理解蘇大強們:語音交互的未來會是老齡化+個性化嗎?

在最近的熱播劇《都挺好》里,“作精老父親”蘇大強憑借他的各種金句在蘇氏男團中成為了毫無疑問的C位。

在這部電視劇中,除了討論所謂“原生家庭與子女”成長的問題以外,同樣也暴露了年輕人與老年人之間的溝通問題。

蘇大強時常出現(xiàn)的詞不達意,重復地說著“我就要錢”,沒完沒了地抱怨他人,在劇中或許意在體現(xiàn)人物性格。但同濟大學最近的研究告訴我們,如果類似的情況發(fā)生在生活中,則有可能是一種病理性的反映。

理解老齡語言能力退化,AI可以做到這些事

老年人說話重復、詞不達意、化繁為簡,似乎已經(jīng)成為了一件很常見的事。遇到這種情況,我們往往只會認為對方是“老了”“糊涂了”??赏瑯邮抢夏耆?,很多人在九十幾歲的時候,依然思維清晰、口若懸河。

同濟大學主辦了首屆全國老年語言學講習班,其中專家提到,嬰幼兒學語的過程獲得了大量的關(guān)注,可老年人語言退化的過程卻不被人重視。

而同濟大學老齡語言與看護研究中心得出結(jié)果稱,在生活態(tài)度積極、身心腦無臨床疾病的老年人與患有一些老齡疾病的老年人之間,其語言表現(xiàn)有著很大的差異。

那些生理年輕比實際年齡更年輕的老年人,語言表現(xiàn)相對正常完整,邏輯也更為清晰。但那些患有老年病的老年人們,則更容易發(fā)生發(fā)生語蝕(語速減緩、音域窄化、語言量減少、手勢增多)、語誤(詞不達意、口誤)甚至產(chǎn)生語言障礙直到最后完全失語。

也就是說,通過老年人語言退化的研究,可以幫助我們更好地認知老年人身體健康狀況的變化,甚至可以幫助我們從多種角度認識阿爾茲海默這種至今尚未找到解決方案的疾病。

在這一過程中,我們不得不依賴于人工智能的幫助。那么在研究老年人語言退化上,AI究竟能做到些什么呢?

從同濟大學和AI獨角獸的合作上,我們大概能總結(jié)出以下幾點。

第一, 通過深度學習對老年人語言特征進行提煉量化,讓詞匯量減少、語義重復、口誤這些偏于感性認知的概念變成可以評分化的理性標準,方便進行下一步研究。

第二, 通過多模態(tài)研究將老年人的語言數(shù)據(jù)與心電圖、腦電圖等等其他數(shù)據(jù)結(jié)合起來進行綜合性研究,高效地將語言衰退與其他疾病表現(xiàn)聯(lián)系起來,發(fā)覺其中的關(guān)聯(lián)。

第三, 建立方便易用的NLP模型,幫助醫(yī)生可以通過一段語音來判斷老年人的語言退化狀態(tài),甚至進一步推測其健康狀態(tài),提升診療尤其是遠程診療的效率。

老齡化社會即將到來,語音交互還沒有準備好

當然,目前我國對老年人語言退化的研究還處于最初級的階段,剛剛開始建立老年人語料庫。相比之下,美國在1999年左右就已經(jīng)開始在進行類似的工作。

AI企業(yè)參與對于老年人語言的研究,不僅僅有利于醫(yī)學的發(fā)展,同樣也對AI企業(yè)自身具有重要的意義。

如今我們已經(jīng)達成了兩種共識,第一,中國正在“堅定不移”地步入老齡化社會,國家統(tǒng)計局日前發(fā)布的《2018年國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》顯示,去年我國60周歲及以上人口首次超過了0-15歲的人口。第二,AI交互的未來一定會以語音為主,以谷歌為首的科技巨頭正在將智能音箱變成各種形狀塞進家中每個角落,就拿智能家居場景來說,以語音溝通各種IoT設備,已經(jīng)成了可以預見的未來。

而在AI的語音識別訓練中,語音音域、對話邏輯等等的變化,都會影響識別的精準度。這就造成了一個問題,如果我們沒有充足的老年人語音處理經(jīng)驗,很有可能到幾十年后,滿屋子的智能家居都無法與我們順暢溝通。

想象一下,未來的空巢青年變成了空巢老人,在想喝一杯手磨咖啡時很可能很難完整的說出“小X小X(智能音箱喚醒詞),讓咖啡機為我制作一杯咖啡”,而是只能重復著“手磨咖啡”這幾個字,而智能音箱則一臉懵的嘗試著與我們不斷進行多輪交互:

“您是否要搜索‘手磨咖啡’?”

“您是否要訂購‘手磨咖啡’外賣?”

……

即使在今天,對于老年語音交互的研究同樣也可以在老年陪護、老年心理健康等領(lǐng)域發(fā)揮作用。就像面對如今大量老年人獨居這種問題,就可以利用熟悉老年人語音交互模式的AI來與老年人對話,紓解他們的心理問題、保持他們的語言能力。

而在這一領(lǐng)域,至今仍是一片空白。

語音交互的縱與橫

不難看出,如今NLP領(lǐng)域中關(guān)于語料的累積和處理,已經(jīng)呈現(xiàn)出了橫向和縱向兩種態(tài)勢。橫向來看,是漢、英、日、俄以及各種少數(shù)民族語言、小語種等等語言類型。縱向來看,則是一個人從童年到老年整體語言能力的發(fā)展變化。

相較之下,更多時候我們?nèi)匀贿€停留在對NLP語料進行橫向耕耘的階段,不斷地深挖語義,盡可能去實現(xiàn)足夠自然的語音交互。但縱向的語言能力變化,同樣對語音交互效果有著巨大的影響。

就拿兒童語音識別來說,兒童音域與成年人不同,語言能力以及對智能產(chǎn)品的認知理解也與成年人有巨大的差異。在谷歌助手、亞馬遜Echo這類產(chǎn)品身上,都曾出現(xiàn)過兒童語音識別不準確的問題。目前已經(jīng)有不少創(chuàng)業(yè)公司,例如來自愛爾蘭的SoapBox Labs已經(jīng)開始著手去建立專屬于兒童的語音識別算法。

其實個體語言能力的差異何止兒童、老年人、成年人這三個維度?不同性別、不同受教育能力、不同細化年齡階段,都可能決定其語言能力的細節(jié)差異。

在未來,當語音交互真正進入細節(jié)化競爭時,很可能出現(xiàn)的是語料數(shù)據(jù)處理平臺化+語音交互方式個性化。

即將語音交互習慣分成幾大類,如男性/女性或成人/兒童/老年人,再在冷啟動時通過幾句簡單的對話交互獲取個人用戶語音數(shù)據(jù),從中再分析出一些更細化的習慣,并在日常使用的過程中不斷進化。

這一整個過程,將會像算法推薦資訊平臺習得我們喜好時一樣簡單。

機器對人語言交互方式的細化理解,終有一天會超過人類彼此之前的理解。就像如今機器翻譯的效率正在逐漸超過人類一樣。

等到那一天,我們將不會再擔憂自己成為“蘇大強”,我們的口是心非與胡言亂語,AI能聽懂就好。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-03-23
在對話中理解蘇大強們:語音交互的未來會是老齡化+個性化嗎?
想象一下,未來的空巢青年變成了空巢老人,在想喝一杯手磨咖啡時很可能很難完整的說出“小X小X(智能音箱喚醒詞),讓咖啡機為我制作一杯咖啡”,而是只能重復著“手磨咖啡”這幾個字,而智能音箱則一臉懵的嘗試著

長按掃碼 閱讀全文