-
公开(公告)号:CN112861865B
公开(公告)日:2024-03-29
申请号:CN202110127714.9
申请日:2021-01-29
Applicant: 国网内蒙古东部电力有限公司 , 南京南瑞信息通信科技有限公司
IPC: G06V30/148 , G06F40/186 , G06V30/416 , G06V30/18 , G06V30/19
Abstract: 本发明公开了一种基于OCR技术的辅助审计方法,包括获取待识别的审计文档图像,对审计文档图像进行预处理,得到审计文档图像的预处理图像,对预处理图像进行版面分析,得到预处理图像的多个文本行,采用优化的字符切割方法对多个文本行中的字符串进行切割,得到多个单个字符的切割图像,对多个单个字符的切割图像进行特征提取与识别,得到识别结果,将识别结果进行版面恢复,输出可编辑文档,根据审计工作流程对可编辑文档进行结构化处理,生成审计数据报表并输出。本发明将传统的文字识别方法与审计工作流程相融合,通过对传统的文字识别算法进行优化改进,提高了文字识别的准确率,方便了审计人员的审计工作,提高了工作效率。
-
公开(公告)号:CN112861865A
公开(公告)日:2021-05-28
申请号:CN202110127714.9
申请日:2021-01-29
Applicant: 国网内蒙古东部电力有限公司 , 南京南瑞信息通信科技有限公司
IPC: G06K9/34 , G06F40/186 , G06K9/00 , G06K9/46 , G06K9/62
Abstract: 本发明公开了一种基于OCR技术的辅助审计方法,包括获取待识别的审计文档图像,对审计文档图像进行预处理,得到审计文档图像的预处理图像,对预处理图像进行版面分析,得到预处理图像的多个文本行,采用优化的字符切割方法对多个文本行中的字符串进行切割,得到多个单个字符的切割图像,对多个单个字符的切割图像进行特征提取与识别,得到识别结果,将识别结果进行版面恢复,输出可编辑文档,根据审计工作流程对可编辑文档进行结构化处理,生成审计数据报表并输出。本发明将传统的文字识别方法与审计工作流程相融合,通过对传统的文字识别算法进行优化改进,提高了文字识别的准确率,方便了审计人员的审计工作,提高了工作效率。
-