金現(xiàn)代OCR平臺|全套OCR組件,速度更快,精度更高!
小到一張發(fā)票、一個(gè)證件,大到會議資料、合同文書,其信息的提取與處理曾是一項(xiàng)費(fèi)時(shí)耗力的任務(wù)。如今,只需用攝像頭掃一掃就能輕松識別并保存。這一切的背后,都離不開光學(xué)字符識別技術(shù)(OCR)強(qiáng)大的支持。
OCR識別示意
近年來,隨著人工智能的不斷發(fā)展,OCR技術(shù)持續(xù)完善和優(yōu)化,為生活帶來諸多便利。但對于企業(yè)而言,OCR技術(shù)在實(shí)際應(yīng)用中依然面臨挑戰(zhàn):
l 除了發(fā)票、卡證等常見場景外,還有大量非標(biāo)準(zhǔn)版式的需求。
l 手寫體、印章、模糊等因素會影響識別效果。
l 在處理敏感信息時(shí),數(shù)據(jù)安全性需要得到保障。
金現(xiàn)代OCR平臺應(yīng)運(yùn)而生,兼具標(biāo)準(zhǔn)化和定制化、高精度、低成本快捷交付的能力,已從研發(fā)端落地實(shí)際生產(chǎn)應(yīng)用,賦能企業(yè)數(shù)字化發(fā)展。
全套OCR組件,一站式快捷調(diào)用
金現(xiàn)代OCR平臺提供涵蓋文件解析、圖像校正、目標(biāo)檢測、文字及表格識別等的全套OCR組件,支持基于基礎(chǔ)能力快速開發(fā)多樣化的上層應(yīng)用,支持通過API接口等快捷調(diào)用,可以覆蓋企業(yè)絕大多數(shù)使用場景。
01文檔識別:可以對文檔中的掃描圖片、插圖、水印、簽字、印章等進(jìn)行識別和解析。可實(shí)現(xiàn)文檔信息的定位與抽取,從而輔助業(yè)務(wù)數(shù)據(jù)的快速錄入、抽取、比對,實(shí)現(xiàn)審核過程的降本增效。
文檔提取關(guān)鍵信息示意
02卡證識別:精準(zhǔn)識別身份證、名片、工作證、駕駛證、會員卡、銀行卡及營業(yè)執(zhí)照等二十余種證件信息,基本涵蓋常見的所有證件類型。
卡證識別示意
03票據(jù)識別:快速識別財(cái)務(wù)發(fā)票、火車票、航空客票等多樣票據(jù)數(shù)據(jù)。借助票據(jù)識別能力可以對員工報(bào)銷中提交的常見票據(jù)進(jìn)行信息的快速抽取,提升報(bào)銷審核效率。
票據(jù)識別示意
04設(shè)備識別:支持準(zhǔn)確讀取設(shè)備儀表數(shù)據(jù),可實(shí)現(xiàn)生僻字符識別,小字符識別,圖像糾偏,實(shí)現(xiàn)設(shè)備的自動取數(shù),提升自動化水平。
設(shè)備識別示意
05圖紙識別:支持對DWG、PDF、圖片等不同格式的圖紙進(jìn)行識別和解析。支持基于圖紙專用模型進(jìn)行識別,將識別準(zhǔn)確率從傳統(tǒng)模式識別下的30%提升至95%。
傳統(tǒng)模式識別和圖紙專用模型識別效果對比
06表格識別:支持各類表格內(nèi)容的識別,對于無框線表格可根據(jù)字符位置的分布轉(zhuǎn)換成表格;框線不完整表格可根據(jù)直線關(guān)系自動補(bǔ)全;跨頁表格可根據(jù)相似度將兩個(gè)表格合并。
實(shí)驗(yàn)報(bào)告表格內(nèi)容識別示意
07印章識別:可使用目標(biāo)檢測算法實(shí)現(xiàn)印章位置的檢測以及是否遮擋文字,再通過圖像處理技術(shù)和Unet算法去除文檔中的印章,避免對后續(xù)OCR的影響。
印章識別示意
多種優(yōu)勢支撐,能力持續(xù)升維
高精度識別:平臺具備對噪點(diǎn)的強(qiáng)抵抗能力,支持對上傳文件進(jìn)行去污、去黑邊、糾偏、旋轉(zhuǎn)等圖像處理功能,常見印刷體的識別準(zhǔn)確率可以達(dá)到95%以上。
高并發(fā)支持:平臺支持100~1000并發(fā),通過集群部署、負(fù)載均衡、異步接口調(diào)用等技術(shù),確保在高并發(fā)場景下依然穩(wěn)定高效。在主流的GPU服務(wù)器支持下,單頁A4圖片或PDF的識別效率不低于1張/秒。
高安全性:支持私有化部署,保證企業(yè)數(shù)據(jù)安全。
國產(chǎn)化支持:支持與X86、ARM架構(gòu)服務(wù)器,銀河麒麟、中科方德、華為歐拉、中興新支點(diǎn)等國產(chǎn)系統(tǒng)進(jìn)行適配。
模型自主訓(xùn)練:支持多種模型的自主訓(xùn)練,如文字識別模型(CRNN、SVTR等),文字檢測模型(DBNet、PSENet等)、目標(biāo)檢測類模型(yolov5、yoloe+等)、圖像分類模型(VGG、ResNet等)。通過模型量化剪枝、知識蒸餾等技術(shù)手段,進(jìn)一步優(yōu)化模型性能,識別效率與準(zhǔn)確性更高。
未來,我們將繼續(xù)探索人工智能技術(shù),對OCR平臺進(jìn)行持續(xù)優(yōu)化和升級,推動技術(shù)創(chuàng)新與應(yīng)用落地,為企業(yè)客戶提供更智能、更高效的解決方案。