日前,云從科技的自然場景OCR(文字識別)技術在ICDAR數據集上取得了多項最佳成績,特別對于東亞語言部分,該文本檢測框架的表現尤為出色,在多個子測試集上(包括中文)都獲得了第一。ICDAR是當前OCR技術領域全球最具影響力的數據集,具有OCR領域奧斯卡之稱。
云從科技提出的Pixel-Anchor框架在兩個具有挑戰(zhàn)性的自然場景文本檢測測試集——ICDAR2015以及ICDAR2017 MLT中,分別在檢測準確率和檢測效率兩個綜合維度上獲得了至今為止最好的結果(FMeasure,一種檢出率和精確度的加權,具體見圖Table 1-Table 3)。該框架在滿足生產環(huán)境實時性要求的基礎上獲得了很高的檢測準確率,該成果可進一步應用于計算機視覺、人工智能技術。同時,阿里巴巴、南京大學與南京理工大學、商湯科技、曠視科技也在榜單中體現出良好的成績,表明中國繼續(xù)在國際上引領OCR領域的研究。
OCR(Optical Character Recognition)是指對輸入圖像進行分析識別處理,獲取圖像中文字信息的過程,具有廣泛的應用場景。而自然場景中的OCR 技術不需要針對特殊場景進行定制,可以識別任意場景圖片中的文字。
和面對高質量文檔圖像的傳統(tǒng)OCR相比,自然場景OCR跳出了對輸入圖像的質量和場景束縛,能夠在更寬泛的領域中獲取應用,引起了學術界以及工業(yè)界的極大關注。
但相較于傳統(tǒng)OCR,自然場景OCR中的各種商品、布景或自然場景圖片中的文本檢測與識別面臨著復雜背景干擾、文字的模糊與退化、不可預測的光照、字體的多樣性、垂直文本、傾斜文本等眾多挑戰(zhàn)。
計算機視覺基礎技術
應用前景廣泛
OCR是計算機視覺領域的經典問題,長久以來,一直受到學術界和工業(yè)界的持續(xù)關注。在工業(yè)界,Google、Microsoft、Amazon等大型互聯(lián)網公司,以及云從科技等人工智能創(chuàng)業(yè)公司,都在OCR技術上耕耘多年。隨著技術不斷成熟,OCR也開始在互聯(lián)網及其他行業(yè)逐步上線使用,應用范圍也從文檔識別擴展到車牌識別,圖片廣告過濾,場景理解,商品識別,街景定位,票據識別等廣泛的領域。
據悉,目前Pixel-Anchor框架已在云從科技的證件票據識別系統(tǒng)和圖片廣告過濾系統(tǒng)中上線,每天處理圖片近千萬張,自動反饋疑似違規(guī)圖片準確率達96%以上;同時將證件處理和圖文審核風險發(fā)現時間從“小時”降低到“秒”級。數據顯示,2018年云從科技累計處理25億證件數據、屏蔽了400萬條惡意推廣,有效提高業(yè)務流程效率及凈化營銷環(huán)境。
除OCR以外,包含人體姿態(tài)、跨鏡追蹤、車輛結構化、語音識別等智能感知的核心技術閉環(huán)已經在云從科技內部獲得建立,比如安防大數據系統(tǒng)與智能商業(yè)運營平臺應用“跨鏡追蹤(ReID)”技術,無需人臉也可以追蹤目標。“逃犯克星”張學友的部分成果,就有“跨鏡追蹤”技術的參與。另外,云從科技也在浸入式大數據風控系統(tǒng)、AI-IoT物聯(lián)網應用等場景中引入了智能感知技術。
- 《GTA 6》或許已經可以試玩,但需等待完善,揭示游戲品質究竟如何
- ChatGPT新功能:OpenAI推出“深度研究”,復雜信息查詢與分析成AI新挑戰(zhàn)
- 三星財報不及預期,2024年Q4營收3774億,前景堪憂
- 華為AR構圖引擎引爆駕駛新體驗:駕駛不再單調,科技讓駕駛更有趣!
- 2025年春節(jié)檔戰(zhàn)火紛飛,哪吒歸來破70億,新星崛起成最大贏家
- AI犯罪抬頭,韓國投資巨額研發(fā)新系統(tǒng)應對深度偽造威脅
- 微信員工揭秘:微信視頻通話并非人人效果不同,卻有輕度美顏,真實不虛
- DeepSeek沖擊波:英偉達市值一周縮水5520億美元,科技巨頭面臨市場變革?
- 美國華盛頓特區(qū)撞機事故調查揭新篇章:數據揭示真相
- 騰訊云NodeJS SDK打包體積過大引發(fā)熱議,官方致歉并承諾后續(xù)優(yōu)化
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。