文 / VRAR星球 維克多
虛擬現(xiàn)實和人工智能領(lǐng)域的先驅(qū)人物路易斯·羅森博格(Louis Rosenberg),近日在知名科技網(wǎng)站VentureBeat發(fā)聲,指出由AI(人工智能)/AR(增強現(xiàn)實)賦能、能增強智力的語境感知AI助手(AI assistants with context awareness),將由Meta引領(lǐng)推動、多家企業(yè)同步研發(fā),在 2024 年進(jìn)入社會,并會在短短幾年內(nèi)顯著改變我們的世界。我們即將生活在一個公司可以將影響我們行為和看法的聲音放進(jìn)我們大腦的世界,拒絕的后果是在競爭中處于劣勢……伴隨這項技術(shù)的負(fù)面問題如果得不到解決,會將社會推向危險境地。
路易斯·羅森博格
羅森博格在VR、AR、AI和人機(jī)交互等方面獲得過300多項專利。早在上世紀(jì)90年代初,他就為美國空軍開發(fā)創(chuàng)建了第一個交互式AR系統(tǒng)。創(chuàng)立了早期的VR公司Immersion Corporation(1993年)和早期的AR公司Outland Research(2004年)、以及3D數(shù)字化公司Microscribe,目前是位于美國斯坦福大學(xué)從事人工智能研發(fā)的Unanimous AI公司CEO。
筆者在2022年介紹過他對虛擬現(xiàn)實的看法:上世紀(jì)九十年代初,是互聯(lián)網(wǎng)謀殺了紅極一時的VR,而今天“由輕型眼鏡支持的增強現(xiàn)實將創(chuàng)造一個AR元宇宙。它將改變我們的生活,取代手機(jī)和臺式機(jī),成為我們數(shù)字內(nèi)容的主要界面?!保ā禫R元老確信虛擬現(xiàn)實技術(shù)十年內(nèi)將獲廣泛應(yīng)用》)
耳中的私語
羅森博格指出,在不久的將來,人工智能助手將會在你耳中安家,竊竊私語,時時為你的日常生活提供幫助。它將積極參與你生活的方方面面,當(dāng)你在擁擠的商店中瀏覽貨架上的商品時,或是帶孩子去看兒科醫(yī)生時,即使是在自家私密空間從櫥柜里拿塊點心時——人工智能助手都會提供有益的信息。它將調(diào)解你的所有經(jīng)歷,包括你跟朋友、親戚、同事及陌生人的社交。
當(dāng)然,“調(diào)解”這個詞是個委婉的說法,即表示允許人工智能影響你的言行、思考和感受。許多人會覺得這個概念令人毛骨悚然。然而,作為一個社會,我們會接受這項技術(shù)進(jìn)入我們的生活,允許自己不斷地受到友善聲音的指導(dǎo),這些聲音以高超的技巧告知并指導(dǎo)我們。不久人們就會知道,我們的生活將會很難離開這些實時幫助。
語境感知AI助手
當(dāng)使用“AI助手”這個短語時,大多數(shù)人會想到像 Siri 或 Alexa 這樣的老式工具——它們允許用口頭指令發(fā)出簡單要求。但這不是正確的思維模式。因為下一代人工智能助手將包括一種改變一切的新成分——語境感知。
當(dāng)你說“hey Siri”時
這種附加性能使系統(tǒng)不僅能夠?qū)δ阏f的話做出反應(yīng),還能對你當(dāng)前所經(jīng)歷的周圍景象和聲音做出反應(yīng),這些景象和聲音由你佩戴在身上的人工智能設(shè)備的攝像頭和麥克風(fēng)捕獲。
不管你是否期待,語境感知AI助手都將在 2024 年進(jìn)入社會,它們會在短短幾年內(nèi)顯著改變我們的世界。它們會釋放出強大的能量,并伴隨著對個人隱私和人事代理的大量新風(fēng)險。
從積極方面來看,無論你走到哪里,這些人工智能助手都會提供有價值的信息,跟你正在做的、說的或看的任何內(nèi)容精確協(xié)調(diào)。指導(dǎo)被如此順暢而自然地傳遞,感覺就像是一種超能力。一個聲音無所不知,在你腦海中盤踞:從商店櫥窗里的產(chǎn)品規(guī)格,到你在徒步旅行中遇到的植物名稱,再到你能用冰箱里散落的食材制作出美味佳肴。
從消極方面來看,這種無處不在的聲音可能具有很強的甚至是操縱性的說服力。因為它可以幫助你完成日常活動,特別是如果公司使用這些值得信賴的AI助手來部署有針對性的對話廣告。
多模態(tài)大型語言模型飛速興起
人工智能操縱的風(fēng)險是可以減輕的,但需要決策者專注于這個關(guān)鍵問題。然而,到目前為止,這一問題基本被忽略了。當(dāng)然,監(jiān)管機(jī)構(gòu)沒有太多時間,這種使語境感知AI助手能夠用于主流用途的技術(shù),至今問世還不到一年。
語境感知AI助手是一種多模態(tài)大型語言模型——一種新的LLM(Large Language Model)。它不僅可以接受文本提示,還可以接受圖像、音頻和視頻的輸入。這是一個巨大進(jìn)步:多模態(tài)模型一下子賦予AI系統(tǒng)自己的眼睛和耳朵,該系統(tǒng)將利用這些感覺器官來評估我們周圍的世界,實時提供指導(dǎo)。
第一個主流多模態(tài)模型是 ChatGPT-4,由 OpenAI 在2023 年 3 月發(fā)布。最近進(jìn)入這一領(lǐng)域的大廠是谷歌,幾周前它宣布了Gemini LLM。
羅森博格認(rèn)為最有趣的模型來自Meta。這個名為 AnyMAL 的多模態(tài) LLM,還帶有運動提示。該模型超越了眼睛和耳朵,增加了前庭的運動感。這可以用來創(chuàng)建一個人工智能助手,它不僅能看到和聽到你所經(jīng)歷的一切,還會考慮你身體的運動狀態(tài)。
一直跟蹤的大問題
隨著這種人工智能技術(shù)現(xiàn)在可供消費者使用,公司正急于將它們構(gòu)建到可以指導(dǎo)您完成日?;拥南到y(tǒng)中。這意味著將攝像機(jī)、麥克風(fēng)和移動運動傳感器放在你的身上,以便為 AI 模型提供信息,并允許它在你生活的方方面面提供語境感知幫助。
放置這些傳感器最自然的地方是眼鏡,因為這樣可以確保攝像頭朝向人注視的方向。眼鏡(或耳機(jī))上的立體聲麥克風(fēng)還能以空間保真捕捉聲景,使人工智能能夠知道聲音的來源——比如是吠叫的狗、鳴笛的汽車還是哭泣的孩子。
在羅森博格看來,目前引領(lǐng)該領(lǐng)域產(chǎn)品發(fā)展的公司是 Meta。兩個月前,他們開始銷售新版Ray-Ban智能眼鏡,該眼鏡配置了高級AI模型。他說自己一直在跟蹤的一個大問題——就是Meta何時會推出提供語境感知AI助手所需的軟件。
Ray-Ban智能眼鏡
現(xiàn)在這不再是一個未知數(shù)。去年12 月 12 日,他們開始提供對AI的早期訪問,其中包括一些非凡的功能。在發(fā)布的視頻中,馬克·扎克伯格要求AI助手為他正在看的襯衫搭配一條褲子,AI助手非常熟練地給出了答案。其他類似的指導(dǎo)AI助手也能提供,像在烹飪、購物、旅行以及社交活動時。而且,援助將是語境感知的。比如,當(dāng)你路過寵物店,AI助手會提醒你購買狗糧。
另一家進(jìn)入這一領(lǐng)域的知名公司是 Humane,它開發(fā)了一種帶有攝像頭和麥克風(fēng)的可穿戴徽章。他們的設(shè)備將于 2024 年初開始發(fā)貨,可能會激起鐵桿技術(shù)粉的想象力。
Humane公司的AI Pin
羅森博格認(rèn)為,眼鏡上的傳感器比戴在身上的傳感器更有效,因為它們可以發(fā)現(xiàn)用戶看著的方向,并且能為視線添加視覺元素。這些元素在今天還只是簡單的疊加,但在未來五年內(nèi),它們將會成為豐富而沉浸式的混合現(xiàn)實體驗。
不管這些語境感知AI助手是否由帶傳感器的眼鏡、耳機(jī)或徽章實現(xiàn),它們都將在未來幾年內(nèi)被廣泛采用。因為它們性能強大,可以提供從外語實時翻譯到歷史知識等各種幫助。
而最重要的是,這些設(shè)備將在社交互動中提供實時幫助,提醒我們在街上遇到的同事的名字,在談話停頓時建議我們說些有趣的事情。甚至可以根據(jù)交談?wù)叩奈⒚蠲娌勘砬榛蚵曇艟€索,在他感到惱火或無聊時及時警告我們。
竊竊私語的人工智能助手會讓每個人看起來更迷人、更聰明、更具社會意識,并可能更有說服力,因為它們實時指導(dǎo)我們。而且,這將成為一場“軍備競賽”,助手們努力給我們提供優(yōu)勢,以保護(hù)我們免受他人影響。
增強智力與數(shù)字鴻溝
作為研究人工智能和混合現(xiàn)實影響的終身研究者,幾十年來羅森博格一直擔(dān)心對話影響的風(fēng)險。為了提高人們的認(rèn)識,幾年前,他發(fā)表了一篇名為《碳約會》的短篇小說,寫一個虛構(gòu)的人工智能,在人的耳邊不斷低聲說著建議。
在故事中,一對老年人第一次約會,兩人完全按人工智能指導(dǎo)說話。這也許是兩個數(shù)字助理的求愛儀式,而不是兩個人,但這種具有諷刺意味的場景可能很快就會變得司空見慣。
當(dāng)然,最大的風(fēng)險不是當(dāng)我們與朋友、家人和戀人聊天時,人工智能助手會插嘴。最大的風(fēng)險是企業(yè)或政府實體如何注入自己的議程,實現(xiàn)強大的對話影響形式,以人工智能生成的定制內(nèi)容為目標(biāo),最大限度地發(fā)揮其對每個人的影響。為了讓公眾了解這些被操縱的風(fēng)險,負(fù)責(zé)任的元宇宙聯(lián)盟最近發(fā)布了《隱私丟失》(Privacy Lost ,2023) ,這是一部關(guān)于人工智能操縱風(fēng)險的短片。
對于很多人來說,允許人工智能助手在他們耳邊竊竊私語,是他們打算避免的令人毛骨悚然的情況。問題是,一旦絕大多數(shù)用戶接受了強大的人工智能工具指導(dǎo),我們這些拒絕這一工具的人將處于劣勢。
事實上,人工智能指導(dǎo)可能會成為生活中基本社交規(guī)范的一部分。你遇到的每個人都希望你在進(jìn)行對話時,實時獲得有關(guān)他們的信息。問別人以什么謀生或在哪里長大,可能會變得很不禮貌,因為這些信息只會出現(xiàn)在你的眼鏡里或在你耳邊低語。
而且,當(dāng)你說出一些聰明或深刻的話語,沒有人知道你是自己想出來的,還是只是在大腦中鸚鵡學(xué)舌地模仿人工智能助手。事實是,我們正在走向一個新的社會秩序,在這個秩序中,我們不僅受到人工智能的影響,而且通過企業(yè)提供的人工智能工具有效地增強了我們的心理和社交能力。
羅森博格把這種技術(shù)趨勢稱為“增強智力”(augmented mentality)。他認(rèn)為這是不可避免的,不過還需更多時間,才能讓人工智能產(chǎn)品,完全可以用于指導(dǎo)日常思維和行為。然而,隨著語境感知LLM的最新進(jìn)展,目前不再存在很大的技術(shù)障礙。
即將到來的可能是一場“軍備”競賽。在這場競賽中,大型科技公司的巨頭們將爭奪誰能把最強大的人工智能指導(dǎo)輸入你的眼睛和耳朵的話語權(quán)。然而,這種企業(yè)推動可能會在那些買得起智能增強工具的人和買不起的人之間造成危險的數(shù)字鴻溝。更糟糕的是,那些負(fù)擔(dān)不起訂閱費的人,可能會被迫接受由聲勢浩大的人工智能對話影響力所提供的贊助廣告。
是采取行動的時候了
羅森博格指出,我們即將生活在一個公司真的可以將影響我們行為和看法的聲音放進(jìn)我們頭腦中的世界。這就是人工智能操縱的問題——它是如此令人擔(dān)憂。我們迫切需要對人工智能系統(tǒng)進(jìn)行積極的監(jiān)管,因為這些系統(tǒng)可以實時圍繞單個用戶實施“閉環(huán)”,在傳遞定制影響的同時感知我們的個人行為。
不幸的是,白宮最近的關(guān)于人工智能的行政命令并沒有涉及這個問題,而歐盟最近的人工智能法案只是一帶而過地觸及了它。然而,旨在指導(dǎo)我們一生的消費電子產(chǎn)品馬上就要充斥整個市場。
最后,他警告道:“隨著我們進(jìn)入 2024 年,我真誠地希望世界各國的政策制定者聚焦人工智能驅(qū)動的對話影響的罕見風(fēng)險,特別是語境感知AI助手的操縱。如果他們深思熟慮地解決這些問題,消費者就可以從人工智能的指導(dǎo)中受益,而不會使社會滑向危險的境地。現(xiàn)在是采取行動的時候了。”
希望羅森博格的警告能引起各國當(dāng)政者重視,并積極采取行動。也希望語境感知AI助手在增強人類智力的同時,能夠避免可能給人類帶來的災(zāi)禍。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。