在談?wù)摗叭四樧R(shí)別”的時(shí)候,我們指的是什么?
當(dāng)下,絕大多數(shù)互聯(lián)網(wǎng)用戶的數(shù)據(jù)正在被搜集,但基本上是識(shí)別型編碼,比如瀏覽器cookies或者電郵地址。代表我們?cè)诰€身份的一切最終都可以轉(zhuǎn)化為一堆數(shù)字和字母,這里面幾乎所有的信息都可以被改變,就好像你隨時(shí)可以申請(qǐng)一個(gè)新的社保號(hào)碼一樣。而臉部數(shù)據(jù)則完全不同,臉部識(shí)別數(shù)據(jù)和公眾用戶的其他生物數(shù)據(jù)一樣,改變成本非常高,有時(shí)候甚至是不可能的。從某種意義上說,臉部數(shù)據(jù)是一種我們所有人無法逃脫的“數(shù)據(jù)鏈路”。
臉部識(shí)別技術(shù)有許多種。第一種是最初級(jí)的,也被稱之為臉部探測,通常用在手機(jī)攝像頭上,在拍照時(shí)對(duì)臉部自動(dòng)對(duì)焦。第二種是臉部分類(facial characterization),分辨臉部肌理,但是能夠判斷的信息也很有限。其他的臉部識(shí)別技術(shù)則有著更復(fù)雜的使用場景。比如一些軟件使用臉部識(shí)別技術(shù)進(jìn)行用戶身份核實(shí),在攝像頭捕捉到確認(rèn)畫面時(shí)激活電腦或是手機(jī)。最令公眾產(chǎn)生警覺的,是用來探測未知用戶身份的臉部識(shí)別功能——也就是將數(shù)據(jù)庫中的人臉數(shù)據(jù)和身份數(shù)據(jù)匹配。
這并非危言聳聽:去年夏天,F(xiàn)acebook的人工智能團(tuán)隊(duì)宣布,其人臉識(shí)別軟件產(chǎn)品達(dá)到了近人類等級(jí)的精確度標(biāo)準(zhǔn)。就在上周,F(xiàn)acebook展示了一項(xiàng)更先進(jìn)的成果:通過使用另一套不同的算法,通過分析目標(biāo)的發(fā)型、身姿和體態(tài),在沒有出現(xiàn)臉部圖像的情況下,也能達(dá)到83%的識(shí)別準(zhǔn)確率。
這種臉部識(shí)別的應(yīng)用場景才是人們最擔(dān)心的,這一點(diǎn)我們?cè)谙挛挠懻摗?/p>
臉部識(shí)別的應(yīng)用場景分兩種:一個(gè)是在線上,虛擬世界,比如電腦通過你上傳的用戶圖像識(shí)別你的身份;另一個(gè)是線下,真實(shí)世界,比如系統(tǒng)通過你在街上被監(jiān)視器拍到照片來識(shí)別你的身份。隱私專家們之間達(dá)成的共識(shí)是,目前企業(yè)界在線上使用臉部識(shí)別技術(shù)的能力大大超越了在線下使用這項(xiàng)技術(shù)的水平。比如上文提到Facebook的新技術(shù),就專門用于在線圖片的分析,能夠在97.25%的識(shí)別中準(zhǔn)確判斷不同照片中是否出現(xiàn)的是一個(gè)人,而人類在同樣的測試中正確率也只有97.5%。線下方面,盡管科技公司們聲稱臉部識(shí)別技術(shù)也有成功案例,但實(shí)際情況卻并非如此。
不過這種線上和線下的界限并不是很明顯。2014年來自卡耐基梅隆大學(xué)的一位教授通過試驗(yàn)發(fā)現(xiàn),對(duì)校園內(nèi)的行人進(jìn)行拍照并且比對(duì)Facebook用戶頭像,有三分之一的人能夠被臉部識(shí)別技術(shù)探測出來。不僅如此,他還成功地使用算法對(duì)這部分人群的興趣甚至社保號(hào)碼進(jìn)行了預(yù)測。換句話說,在線下,已經(jīng)有人實(shí)現(xiàn)33%的臉部識(shí)別準(zhǔn)確率。
分歧:用戶是否需要事先對(duì)臉部識(shí)別進(jìn)行授權(quán)?
2014 年,美國商務(wù)部組織了一次會(huì)議,邀請(qǐng)各方代表探討如何監(jiān)管臉部識(shí)別技術(shù),出席會(huì)議的有美國政府負(fù)責(zé)制定科技政策的部門,還有來自消費(fèi)者隱私保護(hù)組織和科技產(chǎn)業(yè)的代表。雖然這個(gè)會(huì)議仍舊在舉辦,但需要指出的是,消費(fèi)者保護(hù)組織已經(jīng)不在了。美國消費(fèi)者聯(lián)盟和用戶隱私保護(hù)團(tuán)體EFF今年六月宣布退出,他們表示,科技行業(yè)的公司和說客們,堅(jiān)決不承認(rèn)用戶需要事先對(duì)臉部識(shí)別軟件進(jìn)行授權(quán)的權(quán)利,所以繼續(xù)參加此次會(huì)議,已經(jīng)毫無意義。
“假設(shè)現(xiàn)在有一個(gè)人在大街上走,與這個(gè)人沒有關(guān)系的一個(gè)組織,如果想要識(shí)別他的身份,難道不應(yīng)該首先獲取他的同意嗎?”喬治城大學(xué)隱私和科技中心(Georgetown Center on Privacy and Technology)執(zhí)行總監(jiān)阿瓦羅(Alvaro Bedoya)一針見血地指出。阿瓦羅是本次會(huì)議中消費(fèi)者隱私保護(hù)一方的意見領(lǐng)袖,他提出的問題也是消費(fèi)者保護(hù)團(tuán)體退出會(huì)議的根本原因。他還表示,科技行業(yè)不愿意承認(rèn)用戶要對(duì)技術(shù)行為進(jìn)行事先授權(quán)。
政府機(jī)構(gòu)發(fā)言人對(duì)筆者表示,對(duì)于會(huì)議分崩離析“很失望”。代表科技行業(yè)參會(huì)的某科技公司高管則表示,他認(rèn)為在許多情況下用戶授權(quán)是不需要的。
就目前的實(shí)際情況來看,科技公司之間對(duì)于用戶是否應(yīng)該在被臉部識(shí)別之前對(duì)系統(tǒng)進(jìn)行授權(quán)這一點(diǎn),也存在分歧。Facebook的新App應(yīng)用需要用戶額外操作,才能避免被掃描進(jìn)入臉部數(shù)據(jù),這意味著其默認(rèn)是允許的。而微軟公司則向筆者表示,他們?cè)趯?duì)用戶進(jìn)行臉部掃描之前,會(huì)要求用戶給出授權(quán)許可。而Google表示在消費(fèi)者照片產(chǎn)品上完全不使用臉部識(shí)別技術(shù),而是做“臉部數(shù)據(jù)簇”(face clustering),也就是在手機(jī)或電腦的本地將類似的臉部圖像進(jìn)行分組。用戶也可以關(guān)掉這一功能。2013年該公司迫于壓力禁止在Google Glass上發(fā)布臉部識(shí)別App應(yīng)用。
誰會(huì)擁有我們的“臉”?
從公開報(bào)道來看,消費(fèi)者隱私保護(hù)組織和科技行業(yè)代表的分歧,是用戶授權(quán)。那么臉部識(shí)別軟件的政府監(jiān)管,將如何進(jìn)行?在臉部識(shí)別技術(shù)準(zhǔn)確率非常之高的情況下,究竟是誰在掌握著我們的臉部數(shù)據(jù)?
那么政府又在其中扮演著怎樣的角色?目前美國政府的臉部識(shí)別數(shù)據(jù)庫已經(jīng)有 5200萬條數(shù)據(jù),占全美人口的三分之一。盡管這個(gè)數(shù)字已經(jīng)很龐大,但是仍舊落后于公司收集的用戶臉部數(shù)據(jù)。
用戶隱私保護(hù)團(tuán)體 EFF 在退出大會(huì)的聲明中,提出了商業(yè)資源和政府資源的合作問題:“幾年前,在一次信息自由法案(FOIA)主張的調(diào)閱中,我們發(fā)現(xiàn)美國聯(lián)邦機(jī)構(gòu)對(duì)社交媒體公司(如 Facebook)發(fā)布的搜查令包括用戶上傳的所有圖片,也包括用戶被標(biāo)簽的其他人上傳的圖片。未來我們將會(huì)看到政府機(jī)構(gòu)試圖獲取用戶臉部識(shí)別數(shù)據(jù)的情況?!?/p>