“合合信息”智能文字識別技術破解傳統OCR應用難題

如何運用先進的智能文字識別技術,

破解傳統OCR(文字識別技術)應用難題?

在日前舉行的2022中國圖像圖形大會《OCR前沿技術與產業應用》論壇上,大數據企業合合信息公司自然語言算法研發總監丁凱博士介紹的該公司智能文字識別及圖像處理技術,被參加論壇的中科院、北京大學、聯想研究院等頂尖科研機構的專家,一致認爲是破解難題的“鑰匙”。

丁凱介紹,儘管OCR技術已經過一個世紀的發展,但現今仍存在文檔圖像質量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結構化智能理解能力差等亟待解決的問題。OCR技術的進階路上,文檔圖像質量的增強是重要的研究方向,需克服頁面彎曲、陰影遮擋、摩爾紋、圖片模糊等現代文本圖像處理中常見的干擾狀況。

而合合信息公司智能文字識別及圖像處理技術,通過引入AI(人工智能)技術,能夠幫助各應用領域簡化下游文檔處理任務,提升文字識別效率與準確性。

丁凱以彎曲矯正爲例,向參加論壇的專家介紹了基於文本行線擬合和座標變換、基於文本行線優化矯正的方法原理和優缺點。對於這些缺陷,合合信息公司採用的基於位移場網絡學習的方法的系統架構,可有效解決多種彎曲文檔圖像的矯正問題。

同時,爲了更好地解決不同業務中存在的文檔版式繁雜、訓練樣本匱乏、模型定製化調優週期長且效率低的問題,合合信息公司推出了TextIn Studio智能文字識別訓練平臺,可將底層資源、數據、模型訓練、集成部署和服務管理應用多個模塊整合在一起,針對性解決各項問題,建立業務流程之間的閉環,實現模型自動化訓練和部署。

據悉,TextIn Studio生產出了大量不同場景的文檔數字化模型,涉及近百種文檔圖像預處理、文字識別與理解、文檔格式轉換等方面的服務,較爲全面地覆蓋了企業和個人工作生活相關的文檔類型。目前,合合信息公司通過TextIn小程序發起了針對高校研究者羣體需求發起的限時體驗活動,即高校的老師和學生註冊並綁定帶有“edu”後綴的教育郵箱後,每人一年可免費獲得100萬次的OCR服務。

此外,在今年中國圖像圖形大會上,還舉行了第三屆CSIG圖像圖形挑戰賽總決賽頒獎儀式。CSIG圖像圖形挑戰賽旨在促進我國圖像圖形技術及相關產業的發展和應用,解決企業面臨的技術難題,幫助企業引入更多的優秀人才。

由合合信息公司與相關高校及企業生態夥伴組成的參賽隊伍,憑藉在視覺關鍵信息理解層面的算法優勢與多語言票據識別場景的實踐沉澱,不僅獲得“中英文購物小票信息理解賽道”單項冠軍,還通過終輪現場比拼,榮獲了CSIG圖像圖形技術挑戰賽總冠軍。

記者:顧武

編輯:葉蘋

轉載請註明來自上海靜安官方微信