由百度聯合馬來亞大學、華南理工大學、西班牙巴塞羅那自治大學-計算機視覺中心、中國圖象圖形學會主辦的ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標注大規(guī)模街景文字)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字)國際權威競賽任務于5月圓滿結束。此次競賽共吸引來自業(yè)界頂尖技術團隊、高校及科研機構共118支團隊參賽,有效提交結果總計339個。經過兩個月的激烈角逐,ICDAR 2019-ArT競賽五項子任務的冠軍分別由中科院(文字檢測)、曠視(Latin文字識別)、韓國NAVER(Latin中文混合文字識別)、北京航空航天大學(Latin文字、Latin中文混合端到端文字識別)獲得,ICDAR 2019-LSVT競賽文字檢測和端到端文字識別兩項任務冠軍由騰訊團隊獲得。
精英薈聚ICDAR2019 桂冠引群雄爭奪
ICDAR“Robust Reading Competitions”競賽是評估自然場景/網絡圖片/復雜視頻文本提取與智能識別新技術進展的權威國際賽事及評測標準,競賽中涌現出諸多方法持續(xù)推動業(yè)界新技術的創(chuàng)新與應用。在ICDAR2019百度發(fā)布的兩項極具挑戰(zhàn)的競賽任務中, ICDAR 2019-LSVT競賽數據包括5萬張精標注街景圖像、40萬張弱標注街景圖像,聚焦探索大規(guī)模數據場景下深度學習文字識別能力極限。ICDAR2019-ArT競賽數據總計10176張,是業(yè)界最大的任意形狀場景文字集合,聚焦推動自然場景下任意形狀文字檢測識別能力新突破。
各工業(yè)界與學術界頂尖團隊充分發(fā)揮各自技術優(yōu)勢,針對競賽任務不斷優(yōu)化創(chuàng)新方案與算法效果,經過激烈角逐的比賽結果展現出大規(guī)模街景文字識別深度學習、任意形狀文字檢測與識別技術新高度。百度聯合學術界將持續(xù)對該競賽集合及榜單進行維護,為推進相關視覺AI技術領域不斷發(fā)展貢獻力量。
圖1. ICDAR 2019-LSVT競賽結果示例:人工標注 vs 算法效果
圖2. ICDAR 2019-ArT競賽結果示例:人工標注 vs 算法效果
百度OCR實力強勁 多場景應用實踐豐富
此次ICDAR 2019國際競賽任務推動了大規(guī)模街景深度學習文字識別及任意形狀文字識別方向的發(fā)展,是一場學術交流與技術碰撞的盛宴。而在ICDAR 2019國際競賽中,百度OCR承擔競賽組織者角色,這也進一步加強了百度的國際影響力。
百度曾在2015至2019年期間多次獲得ICDAR 2013、 ICDAR 2015、ICDAR 2017-MLT、ICDAR2017-RCTW權威集合檢測、識別、端到端各項任務榜單第一,處于業(yè)內領先水平。近兩年來,百度OCR也多次在CVPR,ICCV,BMVC,ACCV,ICDAR等會議上發(fā)表論文,此次ICDAR 2019有兩篇新工作被接收。"An End-to-end Video Text Detector with Online Tracking" 致力于解決視頻OCR檢測問題,將視頻文字檢測和在線跟蹤任務高效集成到統(tǒng)一、可訓練的網絡框架中。"EATEN: Entity-aware Attention for Single Shot Visual Text Extraction"提出端到端的結構化信息提取方法,同時公開了結構化信息提取領域的大型數據集合。
百度不僅致力于OCR技術領域的縱深研究,同時也是“領先且實用AI視覺技術”的堅定實踐者。多年實踐經驗積累形成了豐富的百度OCR產品矩陣。通用系列文字識別能力不僅能高精度的識別文字,還支持中、英、日、韓、法等十國語言的識別以及置信度、位置等信息的返回;卡證識別能力不僅支持對身份證、銀行卡、護照、名片等常見卡證的識別,還支持卡證采集、分類、屬性判斷等能力;票據識別能力不僅支持財務場景全品類識別,還支持金融、醫(yī)療等場景票據識別;針對終端文字識別場景,百度領先的模型壓縮技術應用于所有OCR終端產品,OCR終端SDK與多家手機廠商達成合作,將識字能力賦予手機。目前,百度OCR產品能力已超50項,在各行業(yè)實現了諸多技術突破與產品落地,覆蓋了財務、銀行、醫(yī)療、政法、教育、交通、電商、快遞等場景。
未來,百度會與各企業(yè)持續(xù)探索OCR的落地可能性,讓OCR賦能更多企業(yè),同時也將持續(xù)秉持普惠的價值理念,在產業(yè)實踐中不斷打磨,持續(xù)賦能服務客戶,持續(xù)打造領先且實用的AI技術,用科技的力量讓復雜的世界更簡單。
- 抖音封禁汪小菲賬號引熱議,哪吒客服遭曝光,網絡文明需共建
- 三星中國換帥:崔勝植黯然退場,李大成能否翻盤引人關注
- Steam Machine前景不明,AMD合作驅動改進成疑,Valve如何應對?
- OpenAI疑似數據泄露,用戶隱私岌岌可危,公司緊急調查
- Meta被指大規(guī)模下載盜版電子書用于AI模型訓練,侵犯知識產權引爭議
- 車市重燃價格戰(zhàn):開年車市“卷瘋”了,消費者迎來購車新格局
- 寶駿汽車深度融合新技術,DeepSeek助力汽車駛向未來
- 哪吒汽車客服錄音風波:車主怒懟下爆粗口辱罵,公司道歉引熱議
- 索尼集團高層變動:十時裕樹接棒成為新CEO,重塑公司管理架構
- iPhone神話在華失寵:銷量下滑,市場份額萎縮,時代變遷?
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。