百度聯(lián)合主辦OCR領域頂級AI競賽ICDAR 2019,上百支精英團隊挑戰(zhàn)超高難度文字識別

百度聯(lián)合主辦OCR領域頂級AI競賽ICDAR 2019,上百支精英團隊挑戰(zhàn)超高難度文字識別

由百度聯(lián)合馬來亞大學、華南理工大學、西班牙巴塞羅那自治大學-計算機視覺中心、中國圖象圖形學會主辦的ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標注大規(guī)模街景文字)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字)國際權威競賽任務于5月圓滿結束。此次競賽共吸引來自業(yè)界頂尖技術團隊、高校及科研機構共118支團隊參賽,有效提交結果總計339個。經(jīng)過兩個月的激烈角逐,ICDAR 2019-ArT競賽五項子任務的冠軍分別由中科院(文字檢測)、曠視(Latin文字識別)、韓國NAVER(Latin中文混合文字識別)、北京航空航天大學(Latin文字、Latin中文混合端到端文字識別)獲得,ICDAR 2019-LSVT競賽文字檢測和端到端文字識別兩項任務冠軍由騰訊團隊獲得。

  精英薈聚ICDAR2019 桂冠引群雄爭奪

ICDAR“Robust Reading Competitions”競賽是評估自然場景/網(wǎng)絡圖片/復雜視頻文本提取與智能識別新技術進展的權威國際賽事及評測標準,競賽中涌現(xiàn)出諸多方法持續(xù)推動業(yè)界新技術的創(chuàng)新與應用。在ICDAR2019百度發(fā)布的兩項極具挑戰(zhàn)的競賽任務中, ICDAR 2019-LSVT競賽數(shù)據(jù)包括5萬張精標注街景圖像、40萬張弱標注街景圖像,聚焦探索大規(guī)模數(shù)據(jù)場景下深度學習文字識別能力極限。ICDAR2019-ArT競賽數(shù)據(jù)總計10176張,是業(yè)界最大的任意形狀場景文字集合,聚焦推動自然場景下任意形狀文字檢測識別能力新突破。

各工業(yè)界與學術界頂尖團隊充分發(fā)揮各自技術優(yōu)勢,針對競賽任務不斷優(yōu)化創(chuàng)新方案與算法效果,經(jīng)過激烈角逐的比賽結果展現(xiàn)出大規(guī)模街景文字識別深度學習、任意形狀文字檢測與識別技術新高度。百度聯(lián)合學術界將持續(xù)對該競賽集合及榜單進行維護,為推進相關視覺AI技術領域不斷發(fā)展貢獻力量。

百度聯(lián)合主辦OCR領域頂級AI競賽ICDAR 2019,上百支精英團隊挑戰(zhàn)超高難度文字識別

圖1. ICDAR 2019-LSVT競賽結果示例:人工標注 vs 算法效果

百度聯(lián)合主辦OCR領域頂級AI競賽ICDAR 2019,上百支精英團隊挑戰(zhàn)超高難度文字識別

圖2. ICDAR 2019-ArT競賽結果示例:人工標注 vs 算法效果

  百度OCR實力強勁 多場景應用實踐豐富

此次ICDAR 2019國際競賽任務推動了大規(guī)模街景深度學習文字識別及任意形狀文字識別方向的發(fā)展,是一場學術交流與技術碰撞的盛宴。而在ICDAR 2019國際競賽中,百度OCR承擔競賽組織者角色,這也進一步加強了百度的國際影響力。

百度曾在2015至2019年期間多次獲得ICDAR 2013、 ICDAR 2015、ICDAR 2017-MLT、ICDAR2017-RCTW權威集合檢測、識別、端到端各項任務榜單第一,處于業(yè)內(nèi)領先水平。近兩年來,百度OCR也多次在CVPR,ICCV,BMVC,ACCV,ICDAR等會議上發(fā)表論文,此次ICDAR 2019有兩篇新工作被接收。"An End-to-end Video Text Detector with Online Tracking" 致力于解決視頻OCR檢測問題,將視頻文字檢測和在線跟蹤任務高效集成到統(tǒng)一、可訓練的網(wǎng)絡框架中。"EATEN: Entity-aware Attention for Single Shot Visual Text Extraction"提出端到端的結構化信息提取方法,同時公開了結構化信息提取領域的大型數(shù)據(jù)集合。

百度不僅致力于OCR技術領域的縱深研究,同時也是“領先且實用AI視覺技術”的堅定實踐者。多年實踐經(jīng)驗積累形成了豐富的百度OCR產(chǎn)品矩陣。通用系列文字識別能力不僅能高精度的識別文字,還支持中、英、日、韓、法等十國語言的識別以及置信度、位置等信息的返回;卡證識別能力不僅支持對身份證、銀行卡、護照、名片等常見卡證的識別,還支持卡證采集、分類、屬性判斷等能力;票據(jù)識別能力不僅支持財務場景全品類識別,還支持金融、醫(yī)療等場景票據(jù)識別;針對終端文字識別場景,百度領先的模型壓縮技術應用于所有OCR終端產(chǎn)品,OCR終端SDK與多家手機廠商達成合作,將識字能力賦予手機。目前,百度OCR產(chǎn)品能力已超50項,在各行業(yè)實現(xiàn)了諸多技術突破與產(chǎn)品落地,覆蓋了財務、銀行、醫(yī)療、政法、教育、交通、電商、快遞等場景。

未來,百度會與各企業(yè)持續(xù)探索OCR的落地可能性,讓OCR賦能更多企業(yè),同時也將持續(xù)秉持普惠的價值理念,在產(chǎn)業(yè)實踐中不斷打磨,持續(xù)賦能服務客戶,持續(xù)打造領先且實用的AI技術,用科技的力量讓復雜的世界更簡單。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2019-05-29
百度聯(lián)合主辦OCR領域頂級AI競賽ICDAR 2019,上百支精英團隊挑戰(zhàn)超高難度文字識別
由百度聯(lián)合馬來亞大學、華南理工大學、西班牙巴塞羅那自治大學-計算機視覺中心、中國圖象圖形學會主辦的ICDAR 2019-LSVT(Large-scale Str

長按掃碼 閱讀全文