360數科榮登OCR國際賽事榜首,前沿科技探索再獲佳績

原標題:360數科榮登OCR國際賽事榜首,前沿科技探索再獲佳績

日前,360數科在ICDAR 2019 SROIE國際大賽OCR單項任務中,超越眾多AI大咖拔得頭籌。ICDAR(國際文檔分析與識別大會)有著“OCR奧斯卡”之稱,賽事兼具權威性與挑戰(zhàn)性,目前已吸引148個國家的頂尖隊伍參與。

360數科本次參加的文本識別算法大賽通道,一方面極其貼近真實業(yè)務場景,對企業(yè)技術應用效果提出了極高要求,一方面以Recall、Precision、Hmean為核心評價指標,考驗企業(yè)技術精準度。此次成績的獲取,標志著360數科技術能力再次受到國際認可。

隨著大數據、人工智能的蓬勃發(fā)展,OCR性能的不斷提升為產業(yè)數字化催生的應用場景提供了堅實支撐。同時,覆蓋移動端和云端的多樣化服務載體,進一步加快了OCR的普及。然而,OCR技術所面對的挑戰(zhàn)與其發(fā)展并存,彎曲文本、長文本、不同語種、生僻字符以及手寫體文字識別等難點仍在尋求更好的解決方案。

360數科在本次競賽中,提出了一種基于RARE改進的新文本識別算法,并與優(yōu)化后的CRNN模型進行了模型融合,并在此基礎上使用了帶有初始值的center loss。除了模型優(yōu)化外,360數科還利用大規(guī)模公開數據集用于預訓練模型,并且生成了大量與訓練集相同圖像風格的仿真數據,在預訓練模型的基礎上進行finetune。最后,應用已訓練完成的自然語言模型,糾正文本識別中的錯誤。

自2018年,360數科就開始積極探索如何將OCR技術應用于業(yè)務。目前已結合業(yè)務實際情況,建立了多個通用文檔圖像數據集,包括并不限學歷認證、執(zhí)業(yè)證書認證、票據識別、行駛證識別、駕駛證識別和營業(yè)執(zhí)照等。目前該算法在上述業(yè)務場景字段精度均高達95%以上。

據360數科首席算法科學家費浩峻介紹,360數科一直把業(yè)務作為技術成長的最有力土壤,技術研究要植根于業(yè)務,并超前于業(yè)務,本次ICDAR 競賽便是對業(yè)務實踐過程中技術積累的一個有效檢驗。未來,除了對端到端網路結構的進一步探索,如何設計更適用于移動端使用的輕量化模型也是公司OCR技術的重點研究方向,只有兼顧效率和精準度的模型才能更好服務于用戶。當前,OCR技術已在金融、保險、醫(yī)療、交通、教育等諸多行業(yè)有了深入成熟的應用。未來隨著傳統行業(yè)的數字化轉型,OCR應用范圍和場景將進一步擴展,市場規(guī)模將進一步增大。360數科將在更多前沿技術探索中,以自身科技能力,壯大金融科技賦能實體的力量。

國際文檔分析與識別大會 ICDAR( International Conference on Document Analysis and Recognition)自 1991 年開始,每兩年一屆。自 2003 年大會開始設立技術競賽,ICDAR 競賽因其極高技術難度和強大實用性,一直是各大科研院校、科技公司的競逐焦點,吸引國內外眾多隊伍參賽。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2022-06-09
360數科榮登OCR國際賽事榜首,前沿科技探索再獲佳績
360數科本次參加的文本識別算法大賽通道,一方面極其貼近真實業(yè)務場景,對企業(yè)技術應用效果提出了極高要求,一方面以Recall、Precision、Hmean為核心評價指標,考驗企業(yè)技術精準度。

長按掃碼 閱讀全文