360數(shù)科榮登OCR國際賽事榜首,前沿科技探索再獲佳績

日前,360數(shù)科在ICDAR 2019 SROIE國際大賽OCR單項任務(wù)中,超越眾多AI大咖拔得頭籌。ICDAR(國際文檔分析與識別大會)有著“OCR奧斯卡”之稱,賽事兼具權(quán)威性與挑戰(zhàn)性,目前已吸引148個國家的頂尖隊伍參與。

360數(shù)科本次參加的文本識別算法大賽通道,一方面極其貼近真實業(yè)務(wù)場景,對企業(yè)技術(shù)應(yīng)用效果提出了極高要求,一方面以Recall、Precision、Hmean為核心評價指標,考驗企業(yè)技術(shù)精準度。此次成績的獲取,標志著360數(shù)科技術(shù)能力再次受到國際認可。

隨著大數(shù)據(jù)、人工智能的蓬勃發(fā)展,OCR性能的不斷提升為產(chǎn)業(yè)數(shù)字化催生的應(yīng)用場景提供了堅實支撐。同時,覆蓋移動端和云端的多樣化服務(wù)載體,進一步加快了OCR的普及。然而,OCR技術(shù)所面對的挑戰(zhàn)與其發(fā)展并存,彎曲文本、長文本、不同語種、生僻字符以及手寫體文字識別等難點仍在尋求更好的解決方案。

360數(shù)科在本次競賽中,提出了一種基于RARE改進的新文本識別算法,并與優(yōu)化后的CRNN模型進行了模型融合,并在此基礎(chǔ)上使用了帶有初始值的center loss。除了模型優(yōu)化外,360數(shù)科還利用大規(guī)模公開數(shù)據(jù)集用于預訓練模型,并且生成了大量與訓練集相同圖像風格的仿真數(shù)據(jù),在預訓練模型的基礎(chǔ)上進行finetune。最后,應(yīng)用已訓練完成的自然語言模型,糾正文本識別中的錯誤。

自2018年,360數(shù)科就開始積極探索如何將OCR技術(shù)應(yīng)用于業(yè)務(wù)。目前已結(jié)合業(yè)務(wù)實際情況,建立了多個通用文檔圖像數(shù)據(jù)集,包括并不限學歷認證、執(zhí)業(yè)證書認證、票據(jù)識別、行駛證識別、駕駛證識別和營業(yè)執(zhí)照等。目前該算法在上述業(yè)務(wù)場景字段精度均高達95%以上。

據(jù)360數(shù)科首席算法科學家費浩峻介紹,360數(shù)科一直把業(yè)務(wù)作為技術(shù)成長的最有力土壤,技術(shù)研究要植根于業(yè)務(wù),并超前于業(yè)務(wù),本次ICDAR 競賽便是對業(yè)務(wù)實踐過程中技術(shù)積累的一個有效檢驗。未來,除了對端到端網(wǎng)路結(jié)構(gòu)的進一步探索,如何設(shè)計更適用于移動端使用的輕量化模型也是公司OCR技術(shù)的重點研究方向,只有兼顧效率和精準度的模型才能更好服務(wù)于用戶。當前,OCR技術(shù)已在金融、保險、醫(yī)療、交通、教育等諸多行業(yè)有了深入成熟的應(yīng)用。未來隨著傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,OCR應(yīng)用范圍和場景將進一步擴展,市場規(guī)模將進一步增大。360數(shù)科將在更多前沿技術(shù)探索中,以自身科技能力,壯大金融科技賦能實體的力量。

國際文檔分析與識別大會 ICDAR( International Conference on Document Analysis and Recognition)自 1991 年開始,每兩年一屆。自 2003 年大會開始設(shè)立技術(shù)競賽,ICDAR 競賽因其極高技術(shù)難度和強大實用性,一直是各大科研院校、科技公司的競逐焦點,吸引國內(nèi)外眾多隊伍參賽。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-06-09
360數(shù)科榮登OCR國際賽事榜首,前沿科技探索再獲佳績
360數(shù)科本次參加的文本識別算法大賽通道,一方面極其貼近真實業(yè)務(wù)場景,對企業(yè)技術(shù)應(yīng)用效果提出了極高要求,一方面以Recall、Precision、Hmean為核心評價指標,考驗企業(yè)技術(shù)精準度。

長按掃碼 閱讀全文