10分鐘完成模型開發(fā)!合合信息智能文字識別服務平臺亮相1024程序員節(jié)

1024是2的十次方,也是二進制計數(shù)的基本計量單位之一,每年的10月24日因此成為了中國程序員的盛會。近期,CSDN(中國開發(fā)者網(wǎng)絡)第三屆“1024程序員節(jié)”(簡稱“大會”)順利舉辦,來自Linaro等開源組織的領導者和微軟、騰訊、華為、合合信息等企業(yè)的技術專家接連登陸主論壇重磅活動《全體大會:2022技術英雄會》,與觀眾云端話科技。

生產(chǎn)生活中,被整齊記錄在二維表結構里的“結構化”數(shù)據(jù)只是少數(shù)。據(jù)國際數(shù)據(jù)公司(IDC)預測,全球非結構化數(shù)據(jù)將在2025年占據(jù)數(shù)據(jù)總量的80%至90%。智能文檔處理技術能夠對各種文件、圖片中的非結構化數(shù)據(jù)進行內容識別和抽取,對推進企業(yè)數(shù)字化轉型意義重大。

怎樣從數(shù)據(jù)中發(fā)現(xiàn)更多的價值,找到更實用的開發(fā)工具,是程序員群體重點關注的話題。合合信息智能創(chuàng)新事業(yè)部總經(jīng)理唐琪受邀分享智能文檔處理的技術優(yōu)化方法及開源渠道介紹,獲得了眾多開發(fā)者的認可。

“智能文檔處理”在開發(fā)者群體中熱度攀升(圖源:CSDN官網(wǎng))

文檔處理之困:識別文字還不夠,版式理解是基礎

智能文檔處理技術本質上是把文檔里的信息從載體中剝離出來,將其對接到其他系統(tǒng),以數(shù)據(jù)的流轉實現(xiàn)流程自動化的技術。典型場景如單據(jù)的自動審核,就是先對單據(jù)進行圖像檢測,從中提取所需信息并錄入到系統(tǒng)里,經(jīng)過結構化處理,“翻譯”成機器能理解的內容后再進行自動判別,達到節(jié)省人工成本、提高工作效率的目的。

唐琪在分享中指出,采集設備的不確定性和文檔版式的多樣性,導致文檔在處理過程中經(jīng)常遇到“看不清、看不準、認不全、難理解”四大類問題。合合信息在彎曲矯正、去摩爾紋(屏幕紋)等圖像質量增強領域進行了深入研究,為信息的提取、存儲、檢索、管理等后續(xù)工作創(chuàng)造良好的環(huán)境。

合合信息去摩爾紋(屏幕紋)技術處理效果

合合信息彎曲矯正技術處理效果

“在各種場景的實踐中我們發(fā)現(xiàn),單純的文字識別不足以支撐更細致的文檔處理需求,版面元素分析才是基礎。”唐琪提到,文檔處理過程中要重點關注對印章、logo、水印、頁眉、二維碼、公式等元素的檢測,根據(jù)檢測結果采取對應的版式分析方式,可得到更精準的識別結果。

合合信息對智能文檔處理的關鍵要素的思考

如何讓已經(jīng)接受過市場檢驗的技術產(chǎn)品惠及更多的開發(fā)者?技術服務的共享是促進科技創(chuàng)新的重要渠道。合合信息將在制造業(yè)、金融業(yè)、物流業(yè)等30個行業(yè)應用里打磨出的核心技術產(chǎn)品“智能文字識別服務平臺”(簡稱“平臺”)以SaaS的形式免費開放給個人開發(fā)者,助力使用者們低成本、高效率獲取貼合個性化需求的定制模型。

合合信息開源平臺:10分鐘完成模型構建,10張樣本即可做訓練

受遠程辦公趨勢發(fā)展和環(huán)保“無紙化”倡導的影響,社會對智能文檔處理技術的需求不斷增加。合合信息智能文檔處理技術可支持全球超過50種主流語言的印刷體、手寫體的高精度識別,以及增值稅發(fā)票、出租車票等20多種票據(jù)的識別,這些通用識別、信息抽取能力被搭載于合合信息智能文字識別服務平臺SaaS版中,并于大會上開放試用。

該平臺提供了海量訓練數(shù)據(jù)快速生成、自動化模型生成、完整的模型訓練和測試等功能,具備低使用門檻、所需樣本少、開發(fā)周期短的優(yōu)勢,使用者通過云端的簡單操作,即可定制提取標準和非標準版式文檔的結構化信息,僅需10張樣本就可以開始訓練。

合合信息智能文字識別服務平臺工作流程

現(xiàn)階段,企業(yè)對于OCR的需求趨向于定制化和多樣化,卻為高昂的開發(fā)成本所限,平臺可為中小企業(yè)的數(shù)字化轉型提供助力。比起傳統(tǒng)的技術方案,企業(yè)更希望被賦予人工智能產(chǎn)品開發(fā)能力,去搭建基于自有業(yè)務場景的識別模型。在平臺上,企業(yè)可通過簡單的配置快速產(chǎn)出結構化識別模型,無需服務器資源與運維投入便可獲取技術支持,降低開發(fā)、部署與運維環(huán)節(jié)中的門檻。

據(jù)悉,實測中應用人員最短可在10分鐘內完成抽取模型開發(fā)全流程,可視化界面設計讓沒有算法基礎的業(yè)務人員也可順利使用。

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )