在臺灣,有一位歌手叫蕭煌奇,他因先天性白內(nèi)障一出生就全盲,在4歲動了眼部手術(shù)后成為弱視。15歲那年,蕭煌奇在重見光明多年后再度失明,但是他一直保持樂觀態(tài)度,熱愛音樂與創(chuàng)作,一首以自己為原型的《你是我的眼》橫空出世,給所有黑暗中的視障人士帶來了鼓勵與溫暖。
“你是我的眼,帶我領(lǐng)略四季的變化”,當(dāng)AI要承擔(dān)起“眼睛”這個角色時,是否能將這個世界帶到視障人士的面前呢?又是否切合了視障人士的真正需求呢?
從感知到“看見“:層出不窮的“助視”產(chǎn)品
不得不說,巨頭們在推進前沿技術(shù)的同時,一直沒有忘記對視障這一弱勢群體的關(guān)懷。一大批助力視障患者的產(chǎn)品和技術(shù)如雨后春筍般涌現(xiàn)。微軟繼前年在主題演講會中講述了人工智能和智能眼鏡幫助盲人“看到”世界后,今年又一次提及了人工智能幫助盲人學(xué)生跨越交流障礙,這些科技里流露的溫情不僅體現(xiàn)了企業(yè)對視障群體的關(guān)懷,也是對科技巨頭最好的品牌廣告。
智能相對論分析師顏璇梳理了各類與視障有關(guān)的智能產(chǎn)品,大致將其分為三種類型:
1.曲線救國型:一般來說,目不能視的視障患者認(rèn)知外界世界的渠道是除了視覺之外的其它感官感覺,比如聽覺、嗅覺和觸覺。比如海倫·凱勒的老師在教她認(rèn)“water”時,讓她伸出一只手去感知水的流動,并在海倫的另一只手上拼寫了這個單詞。
基于此,慕尼黑公司和韓國公司聯(lián)合完成了一款專供盲人使用的盲文智能手表(Dot Watch),搭載了盲文顯示系統(tǒng),以盲文的形式將各種信息呈現(xiàn)在手表的觸摸表盤里。
相機也給出了觸摸形式。美國一位設(shè)計師專門為視障人士設(shè)計了一款to see 3D相機,這款相機能通過鏡頭實時地將拍攝的物體轉(zhuǎn)化成三維觸感數(shù)據(jù),使視障人士通過觸摸屏幕表面生成的立體形狀來識別面部細節(jié),比如讀取表情等。
當(dāng)然了,除了觸覺,聽覺的也不會少。IBM 推出了無障礙環(huán)境的一項發(fā)明——專為盲人設(shè)計的新型導(dǎo)航 APP NavCog。NavCog 可通過耳機與智障人士“耳語”,幫助人實時識別位置、朝向,還能辨認(rèn)迎面走來的熟人。
2.外力加持型:視障人士通常分為兩種,一種是全失明,指完全失去視力,另一種為弱視,即視力不到常人的60%,在視障人士當(dāng)中,弱視群體占到近 70% 的比例。面對這類群體,為他們做一個智能眼鏡就很有必要了。
比如一款名為eSight的產(chǎn)品,結(jié)合算法和部分盲人自身的需要,通過控制器中的液體鏡頭技術(shù)進行“聚焦”,弱視者可以利用眼鏡中的 Bioptic 傾斜功能,不僅可以調(diào)整瞳孔距離(對焦),還可以調(diào)整圖像的清晰度(顏色、對比度、亮度),從而“重獲光明”。
3.直截了當(dāng)型:視覺的產(chǎn)生依賴于三大組織器官:眼球(主要為視網(wǎng)膜)、視神經(jīng)、視皮層。對于視障患者而言,如果想要“一了百了”,恢復(fù)視覺,就必須研發(fā)出能替代這三種組織的假體,即視網(wǎng)膜假體、視神經(jīng)假體和視皮層假體。
國內(nèi)就有研究團隊制作出了人造視網(wǎng)膜,其由體內(nèi)電子微系統(tǒng)和體外電子系統(tǒng)兩部分組成。使用方法是在患者眼球內(nèi)部植入IC芯片,用來接收信息和傳導(dǎo)電信號。然后再為盲人配備一個體外接收系統(tǒng),比如眼鏡。
“眼前的黑不是黑,你說的白是什么白”
即使現(xiàn)在的智能“助視”產(chǎn)品比比皆是,但要真的掀開視障患者眼前的簾子,恐怕還不容易。
首先,當(dāng)我們不斷加大視障患者在其它感官上接受的信息量時,也會帶來不小的后患。比如,從聽覺入手的產(chǎn)品往往會讓使用者戴上耳機,這就會讓盲人與周遭的聲音隔絕,出行在外容易造成危險,而不帶上耳機進行電子播報,容易造成患者的信息外泄。
我們不斷地將智能產(chǎn)品應(yīng)用在視障患者身上時,除了要為他們帶來生活上的方便,更是想讓他們看到這個美麗的世界,無障礙地探索這個世界。當(dāng)我們用一種以其它感官來輔助視覺的技術(shù)思路來實現(xiàn)客觀上的無障礙的時候,肯定會與視障患者主觀上的無障礙有區(qū)別。
其次,可穿戴設(shè)備戴久了,尤其是戴在眼睛上,人們或多或少都會產(chǎn)生不適感。想想我們在電影院看3D電影的時候,3D眼鏡也曾讓我們頭暈?zāi)垦?,沉浸式技術(shù)也極容易帶來頭暈、惡心等反應(yīng)。除此之外,戴智能眼鏡限制了側(cè)面周邊的視覺范圍,視障患者要做到和正常人一樣的移動和工作還是不易。
然后,人造視網(wǎng)膜技術(shù)具有很強的綜合性和復(fù)雜性,需要機器視覺、IC設(shè)計、半導(dǎo)體工藝、納米技術(shù)、神經(jīng)科學(xué)、生物材料等十多個學(xué)科的科學(xué)家和工程師全力投入,密切配合,缺一不可。但即便擁有如此高精度團隊,外界信息通過電信號傳遞到大腦中,盲人感受到的也不過是一個灰度的、馬賽克的世界。
即使是黑白的“渣像素”,也能勉強算“看見”了。而不能算“看見”的那些智能產(chǎn)品,比如智能眼鏡、認(rèn)知助手等,僅僅只能提供語音讓患者接收到相應(yīng)信息?;颊吣茏龅木褪?,在“助手”說前面有障礙物請繞過去時無奈繞開,而不能親眼看看阻攔自己的障礙物究竟是一個石頭還是一輛單車。
最后,這些智能“助視”產(chǎn)品最大的問題就在于它的成本太高,價格太貴,一般人很難負擔(dān)得起。由于致盲因素不同,很多盲人需要高度個性化定制的智能產(chǎn)品,這導(dǎo)致成本居高不下。即使是仿生眼球,也不能適用于所有視障患者,比如加拿大一家醫(yī)療科技公司Ocumentics在去年開發(fā)的仿生鏡片也只適合25歲以上的成年人,此外,患有角膜渾濁、接受過白內(nèi)障手術(shù)、重度視網(wǎng)膜黃斑變性、重度遺傳性視網(wǎng)膜病變、視神經(jīng)損傷等疾病的患者,亦不適合這一療法。
看得見,以看懂表情為標(biāo)準(zhǔn)
歸根究底,不管智能產(chǎn)品有多炫目,對盲人而言,他們更在乎智能產(chǎn)品的實用性,而真正實用的產(chǎn)品于他們而言就是三個字——看得見。
仿生眼球當(dāng)然具有很大的市場,但上文中也提到,這種療法并不適用于所有眼科疾病。智能眼鏡+芯片的組合則是可以通用的,因為其視覺計算能力,人臉識別等功能可以接收外界信息,芯片通過柔性電極陣列來傳輸電信號,刺激視網(wǎng)膜的神經(jīng)細胞,進而傳遞到大腦中,讓盲人看見黑白的影像。
但對于市場來說,通用的就不具有特殊性了,所以,誰能快速抓住“通用”中的亮點以及最不易解決的問題,誰就能在“助視”這方面成為佼佼者。
神經(jīng)科學(xué)家認(rèn)為“人臉識別”有兩個方面,其一是特征識別,也是目前的智能眼鏡配備的識別類型。其二是表情識別。事實上,經(jīng)過了億萬年的進化,人類形成了六七種與情緒密切相關(guān)的基本表情,它們是:快樂、驚奇、悲傷、憤怒、厭惡、輕視和恐懼。這些基本表情是人的本能,不需要學(xué)習(xí)就與生俱來。
目前,我們對臉部特征與表情之間的區(qū)別還不太清楚。在我們看到一個人時,我們大腦里的人臉識別機制就會開始運作,我們會在一瞬間就判斷處這一張臉是不是熟面孔以及這個人的表情如何。但這一瞬間,對于視障患者卻難如登天。
所以,讓AI來幫助盲人看到人的表情或許是智能“助視”在人臉識別上的真正戰(zhàn)場。這一舉動的意義不止在于需要AI去識別更細微的臉部特征,還在于要為盲人獲得更加清晰的圖案,而不是模糊的一個影像。
英國《柳葉刀·全球衛(wèi)生》有一份研究報告預(yù)計,當(dāng)下,全球盲人數(shù)量為3600萬,如果不加強對眼疾的治療,到2050年將增至1.15億。這是一個足夠驚人的數(shù)據(jù),而借助技術(shù)的力量,我們希望,每一個在生活中艱難獨行的盲人,不論他們的年齡大小、環(huán)境狀況如何、貧窮或富有,他們都有和明眼人一樣看美麗世界的權(quán)利。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )