當(dāng)前,我國視障人群總數(shù)已經(jīng)超過1800萬,如何用技術(shù)手段改變他們的現(xiàn)實(shí)困境,是國內(nèi)不少科技企業(yè)正在努力創(chuàng)新的方向。12月14日,在OPPO未來科技大會2021上,小布助手正式推出“無障礙圖像功能”。
作為國內(nèi)首個在智能手機(jī)落地的無障礙圖像信息獲取AI工具,“無障礙圖像功能”借助AI科技解決了之前語音旁白無法識別圖像的行業(yè)痛點(diǎn),幫助視障用戶精準(zhǔn)獲取圖像信息,踐行“科技為人,以善天下”的技術(shù)創(chuàng)新理念。
“助視”產(chǎn)品美中不足,小布助手首發(fā)無障礙圖像功能
據(jù)世界衛(wèi)生組織統(tǒng)計(jì),目前中國存在視力障礙的人群約為總?cè)丝诘?.2%左右,也就是說,每82個人中就有一名視障患者。這些視障患者雖然生活面臨不同的困難,但也受惠于科技的進(jìn)步,特別是在獲取信息方面,涌現(xiàn)出不少的“助視”產(chǎn)品,以智能手機(jī)為例,就有安卓系統(tǒng)的TalkBack、iOS系統(tǒng)的旁白功能。然而,這些“助視”功能仍存在美中不足的地方,它們只能識別文字而無法識別圖像內(nèi)容。也就是說,在視障用戶使用智能手機(jī)時,很容易聽到文字轉(zhuǎn)語音的精準(zhǔn)播報(bào),但若遇到圖像,就只能接受一段“無能為力”的空白播報(bào)。
基于對障礙人群的長期關(guān)注,小布助手針對視障用戶存在的上述痛點(diǎn)問題,進(jìn)行了一系列“有AI無障礙”的能力建設(shè)。在對視障群體進(jìn)行深入調(diào)查后,小布助手搭建了無障礙圖像信息獲取AI工具,通過識別與分析圖像信息并進(jìn)行語音播報(bào),為視障用戶提供從“視覺”到“聽覺”的多模態(tài)交互方式,為視障用戶填上了圖像信息的“空白”。
(功能演示:智能識別、語音播報(bào)環(huán)境中物體)
采用大規(guī)模多模態(tài)預(yù)訓(xùn)練模型,打造最精準(zhǔn)的圖像AI技術(shù)
小布助手首發(fā)落地的“無障礙圖像功能”,在技術(shù)上采用了當(dāng)前業(yè)界最大的中文多模態(tài)通用預(yù)訓(xùn)練模型,實(shí)現(xiàn)了對深度學(xué)習(xí)、大數(shù)據(jù)、自然語言處理等前沿技術(shù)的應(yīng)用突破。該模型具有基于視覺-語言弱相關(guān)的假設(shè)、多模態(tài)與對比學(xué)習(xí)算法結(jié)合、網(wǎng)絡(luò)結(jié)構(gòu)靈活且方便實(shí)際部署等特點(diǎn),同時在基礎(chǔ)架構(gòu)上采用了更有優(yōu)勢的雙塔結(jié)構(gòu),圖文互檢預(yù)訓(xùn)練任務(wù)上則使用了基于MoCo的多模態(tài)對比學(xué)習(xí)方法,使得對應(yīng)的圖文對在該特征空間下有一致的語義表示。
在實(shí)際的使用體驗(yàn)中,只要用戶打開手機(jī)TalkBack功能,就會被默認(rèn)為視障用戶。當(dāng)遇到圖像內(nèi)容時,用戶可在TalkBack提示當(dāng)前為圖片信息時喚醒小布助手,發(fā)出類似“這是什么圖”的指令,小布助手就會立馬對當(dāng)前圖像內(nèi)容進(jìn)行解析,并生成自然語言描述播報(bào)給用戶,真正地將人性化落實(shí)到每一個細(xì)節(jié)當(dāng)中。
秉承科技為人理念,讓創(chuàng)新更具人文關(guān)懷
在去年的OPPO未來科技大會上,OPPO首次對外闡釋“科技為人,以善天下”的理念,而在今年OPPO未來科技大會上,OPPO則進(jìn)一步提出了“致善 · 前行”的主題。
小布助手在不斷對科技進(jìn)行創(chuàng)新應(yīng)用之時,秉承科技為人的理念,針對不同群體的真實(shí)需求,特別是當(dāng)前科技高速發(fā)展下的老弱人士、障礙人群,通過推出小布助手關(guān)懷版來對手機(jī)體驗(yàn)進(jìn)行適老化改造,并發(fā)布讓視障人士“看見”圖像的“無障礙圖像功能”,將科技冰冷一面置于黑箱之中,在產(chǎn)品功能和服務(wù)形式上更加“人性化”,帶來一次次令用戶“怦然心動”的科技體驗(yàn)。
科技創(chuàng)新不能忽視“人”的需求,小布助手以AI技術(shù)為輔助工具,為視障者打開光明之窗,讓他們“看見”世界。未來,小布助手將持續(xù)深耕技術(shù)研發(fā)和創(chuàng)新,不斷為更廣泛的障礙人群提供AI科技輔助工具與人文關(guān)懷,讓每個人都能感受到世界的溫暖與科技之美。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )