文檔圖像識(shí)別領(lǐng)域頂級(jí)賽事“ICDAR2023”,實(shí)在智能展現(xiàn)AI雄厚實(shí)力!

近年來(lái)隨著深度學(xué)習(xí)的不斷前進(jìn),包括場(chǎng)景文本檢測(cè)與識(shí)別技術(shù)在內(nèi)的光學(xué)字符識(shí)別(Optical Character Recognition,OCR)得到了飛速發(fā)展。然而,印章這一生活辦公中隨處可見(jiàn)的重要元素卻未獲得關(guān)注,印章抬頭識(shí)別這一重要課題也面臨各式各樣的印章形狀、彎曲的文本內(nèi)容、復(fù)雜的背景要素以及無(wú)處不在的重疊文本等諸多難題。今年舉辦的第17屆ICDAR國(guó)際學(xué)術(shù)競(jìng)賽中,就設(shè)置了印章抬頭識(shí)別競(jìng)賽板塊,為針對(duì)性解決印章抬頭文本檢測(cè)和端到端印章抬頭文本內(nèi)容識(shí)別痛點(diǎn)尋求方案。

ICDAR(International Conference on Document Analysis and Recognition)是全球文檔圖像分析識(shí)別領(lǐng)域公認(rèn)的權(quán)威學(xué)術(shù)會(huì)議,也是世界上舉辦最早和最成功的OCR賽事之一,更是評(píng)測(cè)和檢驗(yàn)自然場(chǎng)景/網(wǎng)絡(luò)圖片文本自動(dòng)提取與智能識(shí)別最新技術(shù)研究進(jìn)展的重要國(guó)際賽事及標(biāo)準(zhǔn)。ICDAR系列賽事的高技術(shù)難度、高實(shí)際應(yīng)用性,備受眾多科研院校、科技公司的廣泛關(guān)注,賽事舉辦至今已有119個(gè)國(guó)家的7821多支隊(duì)伍參與其中,持續(xù)為OCR技術(shù)發(fā)展注入推動(dòng)力量。

本次大賽的2023印章抬頭識(shí)別競(jìng)賽板塊(ICDAR 2023 Reading the Seal Title)由多位領(lǐng)域?qū)<医M織展開(kāi),實(shí)在智能作為AI領(lǐng)域的準(zhǔn)獨(dú)角獸企業(yè),憑借在人工智能領(lǐng)域深耕多年的豐厚經(jīng)驗(yàn)和領(lǐng)先的技術(shù)方案,與浙江大學(xué)、中國(guó)科學(xué)院信息工程研究所、中國(guó)移動(dòng)云中心等優(yōu)秀單位共同位列十強(qiáng)!

實(shí)在智能此次參賽的解決方案,是基于先前領(lǐng)域內(nèi)研究成果進(jìn)一步創(chuàng)新提出的“兩階段”的識(shí)別方法:第一階段檢測(cè)彎曲文本方案提出以五階的貝塞爾曲線擬合彎曲文本,實(shí)驗(yàn)證明這一改進(jìn)取得了更好的擬合效果;第二階段對(duì)抬頭文本的識(shí)別中設(shè)計(jì)了更強(qiáng)大的骨干網(wǎng)絡(luò),增對(duì)各個(gè)印章類(lèi)型設(shè)計(jì)了在線增強(qiáng)策略,合成了10萬(wàn)張合成數(shù)據(jù)用于訓(xùn)練,最終在Task 2. End-to-end Seal Title Recognition 任務(wù)上排名挺進(jìn)前十。此次競(jìng)賽中的優(yōu)秀成績(jī),再一次彰顯了實(shí)在智能突出的全自研OCR能力。

目前,實(shí)在智能已結(jié)合產(chǎn)品落地經(jīng)驗(yàn)和收集的語(yǔ)料,繼續(xù)迭代優(yōu)化了OCR檢測(cè)和識(shí)別模型,實(shí)現(xiàn)了自有的通用文字識(shí)別、表格識(shí)別、鍵值抽取、通用證照、印章識(shí)別等功能,其AI產(chǎn)品IDP文檔審閱正是通過(guò)運(yùn)用光學(xué)字符識(shí)別(OCR)、自然語(yǔ)言處理能力(NLP)等前沿技術(shù)為核心的文本智能處理智能產(chǎn)品,應(yīng)用于信息電子化、風(fēng)險(xiǎn)預(yù)警等業(yè)務(wù)領(lǐng)域,為賦能更多行業(yè)數(shù)字化升級(jí)轉(zhuǎn)型帶來(lái)場(chǎng)景解決方案。

在此基礎(chǔ)上,實(shí)在智能近期還融合人工智能領(lǐng)域前沿的大型語(yǔ)言模型(LLM)和OCR、NLP等核心技術(shù),進(jìn)一步賦能IDP文檔審閱,推出了首款能夠自動(dòng)讀懂文檔并與用戶交流對(duì)話的Chat-IDP。

Chat-IDP是借助行業(yè)領(lǐng)先AI能力,OCR、NLP、LLM等核心技術(shù),實(shí)現(xiàn)AI處理文檔的一款智能產(chǎn)品,能夠自動(dòng)分析內(nèi)容密集、篇幅長(zhǎng)、非結(jié)構(gòu)化的文檔,從而實(shí)現(xiàn)內(nèi)容風(fēng)險(xiǎn)審查、智能歸檔、關(guān)鍵信息抽取、比對(duì),創(chuàng)新打造了智能文本審核的全新范式,進(jìn)一步優(yōu)化了AI能力邊界,提升用戶的交互使用體驗(yàn),以更自動(dòng)化、智能化的文檔審閱流程節(jié)省人工閱讀文檔以及檢索關(guān)鍵信息的精力以及時(shí)間成本,在確保95%以上準(zhǔn)確率的基礎(chǔ)上,幫助業(yè)務(wù)人員實(shí)現(xiàn)效率提升超5倍的智能文檔審核工作。

值得一提的是,實(shí)在智能在OCR、NLP、CV等關(guān)鍵技術(shù)方面均已取得重要突破,擁有位居行業(yè)第一的數(shù)百項(xiàng)獨(dú)立自主知識(shí)產(chǎn)權(quán)和數(shù)十項(xiàng)實(shí)際授予發(fā)明專(zhuān)利。今后,實(shí)在智能也將基于大型語(yǔ)言模型領(lǐng)域的開(kāi)發(fā)能力與經(jīng)驗(yàn),繼續(xù)堅(jiān)持客戶第一的價(jià)值觀,在全面支持信創(chuàng)的實(shí)在RPA產(chǎn)品體系中整合進(jìn)大型語(yǔ)言模型技術(shù),加速實(shí)現(xiàn)部分領(lǐng)域的“即說(shuō)即所得”服務(wù)能力,以創(chuàng)新的交互方式與技術(shù)能力確保為千行百業(yè)的客戶打造契合多重場(chǎng)景需求的AI落地應(yīng)用,助其輕松上手各類(lèi)數(shù)字化工具。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )