日前,360數(shù)科在ICDAR 2019 SROIE國際大賽OCR單項任務(wù)中,超越眾多AI大咖拔得頭籌。ICDAR(國際文檔分析與識別大會)有著“OCR奧斯卡”之稱,賽事兼具權(quán)威性與挑戰(zhàn)性,目前已吸引148個國家的頂尖隊伍參與。
360數(shù)科本次參加的文本識別算法大賽通道,一方面極其貼近真實業(yè)務(wù)場景,對企業(yè)技術(shù)應(yīng)用效果提出了極高要求,一方面以Recall、Precision、Hmean為核心評價指標,考驗企業(yè)技術(shù)精準度。此次成績的獲取,標志著360數(shù)科技術(shù)能力再次受到國際認可。
隨著大數(shù)據(jù)、人工智能的蓬勃發(fā)展,OCR性能的不斷提升為產(chǎn)業(yè)數(shù)字化催生的應(yīng)用場景提供了堅實支撐。同時,覆蓋移動端和云端的多樣化服務(wù)載體,進一步加快了OCR的普及。然而,OCR技術(shù)所面對的挑戰(zhàn)與其發(fā)展并存,彎曲文本、長文本、不同語種、生僻字符以及手寫體文字識別等難點仍在尋求更好的解決方案。
360數(shù)科在本次競賽中,提出了一種基于RARE改進的新文本識別算法,并與優(yōu)化后的CRNN模型進行了模型融合,并在此基礎(chǔ)上使用了帶有初始值的center loss。除了模型優(yōu)化外,360數(shù)科還利用大規(guī)模公開數(shù)據(jù)集用于預訓練模型,并且生成了大量與訓練集相同圖像風格的仿真數(shù)據(jù),在預訓練模型的基礎(chǔ)上進行finetune。最后,應(yīng)用已訓練完成的自然語言模型,糾正文本識別中的錯誤。
自2018年,360數(shù)科就開始積極探索如何將OCR技術(shù)應(yīng)用于業(yè)務(wù)。目前已結(jié)合業(yè)務(wù)實際情況,建立了多個通用文檔圖像數(shù)據(jù)集,包括并不限學歷認證、執(zhí)業(yè)證書認證、票據(jù)識別、行駛證識別、駕駛證識別和營業(yè)執(zhí)照等。目前該算法在上述業(yè)務(wù)場景字段精度均高達95%以上。
據(jù)360數(shù)科首席算法科學家費浩峻介紹,360數(shù)科一直把業(yè)務(wù)作為技術(shù)成長的最有力土壤,技術(shù)研究要植根于業(yè)務(wù),并超前于業(yè)務(wù),本次ICDAR 競賽便是對業(yè)務(wù)實踐過程中技術(shù)積累的一個有效檢驗。未來,除了對端到端網(wǎng)路結(jié)構(gòu)的進一步探索,如何設(shè)計更適用于移動端使用的輕量化模型也是公司OCR技術(shù)的重點研究方向,只有兼顧效率和精準度的模型才能更好服務(wù)于用戶。當前,OCR技術(shù)已在金融、保險、醫(yī)療、交通、教育等諸多行業(yè)有了深入成熟的應(yīng)用。未來隨著傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,OCR應(yīng)用范圍和場景將進一步擴展,市場規(guī)模將進一步增大。360數(shù)科將在更多前沿技術(shù)探索中,以自身科技能力,壯大金融科技賦能實體的力量。
國際文檔分析與識別大會 ICDAR( International Conference on Document Analysis and Recognition)自 1991 年開始,每兩年一屆。自 2003 年大會開始設(shè)立技術(shù)競賽,ICDAR 競賽因其極高技術(shù)難度和強大實用性,一直是各大科研院校、科技公司的競逐焦點,吸引國內(nèi)外眾多隊伍參賽。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 江湖老劉測評vivo Y300 Pro:超強續(xù)航,影像新標桿
- 訊飛星火與昇騰AI雙向奔赴:本土化技術(shù)創(chuàng)新應(yīng)對全球化挑戰(zhàn)的一次成功驗證
- 模塊化筆記本Framework:理念新穎但難以在國內(nèi)市場立足
- 打通“人工智能+”任督二脈,超聚變AI Space有妙招
- “穩(wěn)得一批”的海爾智家,也有點“頭大”?
- 小象超市,難成美團「救命稻草」
- 營收雷打不動,愛奇藝揮刀向自己下狠手
- vivo發(fā)布全新AI戰(zhàn)略 藍心大模型矩陣及原系統(tǒng)5迎來重磅升級
- Wi-Fi 7來襲:是時候升級你的家用網(wǎng)絡(luò)了嗎
- vivo底層技術(shù)持續(xù)突破,開發(fā)者大會亮出新武器
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。