看筆跡識(shí)國籍?一起來看AI加持下的筆跡識(shí)別進(jìn)化之路

原標(biāo)題:看筆跡識(shí)國籍?一起來看AI加持下的筆跡識(shí)別進(jìn)化之路

筆者高中時(shí)期,班里有一條完整的“假條產(chǎn)業(yè)鏈”。有人負(fù)責(zé)在外面打印店打印假條,有人負(fù)責(zé)模仿政教處主任簽字,有人負(fù)責(zé)模仿班主任簽字,還有人負(fù)責(zé)畫政教處的印章。幾個(gè)人功夫了得,每張假條5毛錢,出門成功率幾乎高達(dá)百分之百。

當(dāng)然,有人造假就有人打假。不知是誰走漏了風(fēng)聲(很可能是班主任安排的內(nèi)奸),在某一個(gè)時(shí)間節(jié)點(diǎn)門衛(wèi)突然開始嚴(yán)查假請(qǐng)假條,重點(diǎn)識(shí)別我們班的“工業(yè)流水產(chǎn)品”,導(dǎo)致出門成功率直線下降。假條沒了市場,幾個(gè)人又怕被查到,于是金盆洗手,火熱的假條交易從此就落下了帷幕。此后沉渣雖又泛起了幾次,但再也成不了氣候了。

這充分說明,造假,尤其是筆跡造假這事兒其實(shí)挺簡單的,但要不認(rèn)真看的話也很難辨別真?zhèn)?。學(xué)生尚且能如此,遑論那些專業(yè)的筆跡造假人員,簽字、印章造假之事更是層出不窮。自然,在識(shí)別筆跡這件事兒上,人們也是下足了功夫。

分辨真假:傳統(tǒng)筆跡識(shí)別的力之所及

筆跡識(shí)別其實(shí)是一件難度很高的事情。當(dāng)然,這里討論的主要是涉及到重要利益問題時(shí)候的筆跡造假。這種情況下,肯定不會(huì)找一些畫虎類貓的人隨隨便便就把別人名字給寫上去了,要找也得是有過專門的模仿經(jīng)驗(yàn)的專業(yè)人員。

那么,在這種情況下,想要用肉眼就辨別真?zhèn)?,就真的有點(diǎn)兒勉為其難了。因此,除了神奇的古人,要想讓識(shí)別字跡這事兒變得靠譜,只能是借助計(jì)算機(jī)了。

筆跡識(shí)別的難點(diǎn)在于,其可供分析的樣本較少,因此難以建立有效的字跡對(duì)比模型。比如,對(duì)識(shí)別真假簽名,上哪兒去找那么多名字呢?人家也不可能處處留名。

因此,對(duì)筆跡的識(shí)別流程往往比較復(fù)雜,目前來說主要包括分別檢驗(yàn)兩種筆跡的運(yùn)筆自然程度、大小、字形結(jié)構(gòu),確定兩種筆跡的特征,然后進(jìn)行比較各種特征的異同,最終做出綜合判斷。在人力時(shí)代,進(jìn)行比較的時(shí)候以目力觀察為主,常常需要借助攝影儀、顯微鏡、幻燈片等進(jìn)行對(duì)比研究。

清華大學(xué)和公安部曾經(jīng)推出一款能自動(dòng)鑒別筆跡的“計(jì)算機(jī)筆跡識(shí)別系統(tǒng)”,其能將整個(gè)檢驗(yàn)、對(duì)比和判斷的過程自動(dòng)化,對(duì)筆跡識(shí)別精準(zhǔn)度的提升有很大的作用。

另外一個(gè)涉及到辨別真?zhèn)蔚姆绞絼t是對(duì)筆跡的時(shí)間進(jìn)行推斷。我們?cè)陔娨暽辖?jīng)常會(huì)看到有人拿著借條聲稱某人借錢不還,但實(shí)際上簽名卻是新的。這里就用到了書寫時(shí)間鑒定的技術(shù)。

目前來說,可以做到通過對(duì)墨水成分的鑒定來看是否為同一支筆;通過墨跡的對(duì)墨水的溶解率的檢測判斷書寫時(shí)間;并且在有公章的情況下,可以檢測公章和簽字的覆蓋關(guān)系。

但是受限于文件的存放時(shí)間、存放條件、墨水的材料等諸多因素,鑒定的結(jié)果也會(huì)受到影響。以目前的技術(shù)而言,受這些因素的影響,其時(shí)間精確的誤差可從幾天大到幾個(gè)月之間。

可以看出的是,傳統(tǒng)的筆跡識(shí)別主要是停留在辨別真?zhèn)蔚膶用?。由于技術(shù)條件的限制,其精準(zhǔn)度有待提高,作為證據(jù)采用的可信度自然尚需斟酌。但相比手工時(shí)代輕易的魚目混珠,利用計(jì)算機(jī)來進(jìn)行筆跡識(shí)別和判斷墨跡時(shí)間已經(jīng)是一個(gè)非常大大的進(jìn)步了。

當(dāng)然,永不滿足的人類還想要更大的進(jìn)步。

從看人格到定國籍:AI時(shí)代的筆跡識(shí)別新大陸

對(duì)解決傳統(tǒng)的筆跡識(shí)別問題,AI或許可以幫上一點(diǎn)忙。雖然AI也需要充分的樣本學(xué)習(xí)才能建立較為準(zhǔn)確對(duì)比模型,但在同樣的數(shù)據(jù)條件下,AI的深度學(xué)習(xí)能力能幫助其作出相對(duì)更精準(zhǔn)的判斷。

而AI的重要意義不僅僅在于緩解傳統(tǒng)筆跡識(shí)別的問題,更在于其為筆跡識(shí)別開發(fā)出了新的可能。

1. 人格預(yù)測。Sinhgad Institute of Technology的研究人員們通過對(duì)單詞的頁邊距(在固定網(wǎng)格中的位置)、單詞間距、行距等幾個(gè)方面進(jìn)行切割分析過筆壓、大小、邊距、字體區(qū)域、傾斜程度、基線等進(jìn)行特征提取,然后將其分類,并分析其不同類別與人格、情感的關(guān)系。在經(jīng)過學(xué)習(xí)之后,系統(tǒng)可以在最短的時(shí)間內(nèi)進(jìn)行情緒的識(shí)別和人格的預(yù)測,從而提高人格預(yù)測的準(zhǔn)確性。

2. 國籍識(shí)別。一個(gè)由中國、馬來西亞和印度研究人員組成的研究小組則將字體作為與虹膜、面部等有相通作用的生物特征的一種,以此來判斷其國籍、性別等,從而來查明涉及不同國家國民的罪行。

在方法上,其通過對(duì)中國、印度、馬拉西亞、伊朗和孟加拉國等五個(gè)亞洲國家的100位作家的書寫英文的字跡進(jìn)行分析,利用一種名為cold的線性分布識(shí)別工具,從線條、傾斜方向、整體形狀等方面來對(duì)AI系統(tǒng)進(jìn)行訓(xùn)練學(xué)習(xí)。比如中國人漢字橫平豎直,因此寫英文的時(shí)候呈現(xiàn)出線條偏硬的特征;而印度和孟加拉國寫字則偏圓潤。除此之外,100位作家中還有10位女性,因此其還順便測試了一把男女的差別。

如果說僅僅辨別真假還是初階的話,那用AI通過識(shí)別字體能夠判斷人的性格乃至國籍就有點(diǎn)一步躍升到高階的味道了。而從另一個(gè)角度來說,這也有一定的科學(xué)依據(jù)。畢竟,在之前曾有人研發(fā)出AI的步態(tài)識(shí)別技術(shù),通過一個(gè)人的姿勢(shì)來判斷人,說明這種生物行為在每個(gè)人身上都是不一樣的。那么,寫字作為動(dòng)作的一種,人的性格、生理等諸多因素也很可能會(huì)對(duì)它產(chǎn)生影響。

而中國人也常說,“字如其人”,這句話在今天看來,算是找到了科學(xué)依據(jù)。

但無論是人格判斷還是國籍識(shí)別,其都尚且只是停留在論文或?qū)嶒?yàn)室層面,要想走入現(xiàn)實(shí),恐怕仍然有很長的一段路。

以筆為矛:小筆跡下的大用處

當(dāng)想象的邊界被AI無限延展,筆跡識(shí)別也將突破原有的狹窄應(yīng)用區(qū)域。僅僅做辨別真假這事兒就顯得有點(diǎn)太低端,至少下面的這些事情,未來將有可能搭上筆跡識(shí)別的快車。

1. 法務(wù)判斷的參考。通過對(duì)字跡的國籍、性別的判斷,對(duì)犯罪嫌疑人的鎖定和篩選范圍也將縮小,有利于節(jié)省大量的篩查排除時(shí)間。而據(jù)《民事訴訟法》規(guī)定,鑒定結(jié)論也屬于證據(jù)的一種。那么在利益關(guān)系比較突出的經(jīng)濟(jì)案件中,筆跡識(shí)別精準(zhǔn)度的提高,也將提高法官對(duì)案情的判斷能力。

2. 心理疾病的診斷。在心理診斷中,目前多是采用對(duì)話的形式。如果可以大量搜集心理疾病患者的字體,然后用機(jī)器學(xué)習(xí)的方法對(duì)其進(jìn)行分析和建模,則可以為心理疾病的診斷提供又一強(qiáng)大的判斷依據(jù)。再結(jié)合原有的對(duì)話、測試等手段,心理疾病的診斷正確率有可能會(huì)隨之大大提高。比如患有精神分裂癥的人,其常常會(huì)自造字詞,文字的布局混亂、留白和間距小、字跡潦草等特征明顯,總體呈現(xiàn)出混亂而不規(guī)范的特點(diǎn)。

3. 生理疾病的輔助。有研究表明,筆跡里其實(shí)隱藏生理疾病的密碼。比如帕金森病人的字會(huì)越寫越小,并且字跡會(huì)很淺;阿爾茨海默癥則呈現(xiàn)書寫缺乏規(guī)律;高血壓病字跡會(huì)重……這對(duì)于提早發(fā)現(xiàn)病情,及時(shí)預(yù)防和治療將起到重要作用。

值得注意的是,一旦涉及到診斷疾病,那就要謹(jǐn)防有江湖騙子趁此機(jī)會(huì)發(fā)不義之財(cái)了……

4. 收藏品的鑒別。收藏有風(fēng)險(xiǎn),入行須謹(jǐn)慎。收藏界最怕的事兒就是買到假貨。有的文盲喜歡買幾幅名家字畫往家里客廳里一掛,順便附庸個(gè)風(fēng)雅。一旦買到贗品,被行家識(shí)破后丟人事小,白花花的銀子就這么扔了就可惜了。那么,在入手之前對(duì)字畫識(shí)別一番,既能對(duì)筆跡進(jìn)行分辨,還能對(duì)墨跡進(jìn)行檢測,媽媽再也不擔(dān)心自己被騙了。當(dāng)然,賣假貨的可能會(huì)堅(jiān)決抵制,理由是擾亂了假貨市場秩序……

可見,筆跡雖小,卻也有大用處。這也是AI的神奇之處。它令一些已知可能得到升級(jí),又將未知的不可能的事情變成了現(xiàn)實(shí)。它時(shí)不時(shí)扔出來一件足以令我們咋舌的事情,卻也讓我們看到了AI之于這個(gè)偉大時(shí)代的意義。

當(dāng)然,以后再想模仿班主任簽名,可能連門兒都沒有了。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-11
看筆跡識(shí)國籍?一起來看AI加持下的筆跡識(shí)別進(jìn)化之路
原標(biāo)題:看筆跡識(shí)國籍?一起來看AI加持下的筆跡識(shí)別進(jìn)化之路筆者高中時(shí)期,班里有一條完整的“假條產(chǎn)業(yè)鏈”。

長按掃碼 閱讀全文