一种基于OCR的论文封皮自动识别系统及方法
摘要:
本发明公开了一种基于OCR的论文封皮自动识别系统,模板设计模块,设计封皮模板并提供信息给模块;图像处理模块,通过OCR对图像进行彩色二值化、去黑边、纠偏处理;字符数据采集模块,利用OCR提取封皮字的信息,为定位区域找到对应的题录信息提供数据支持;数据定位模块,将所述字符数据采集模块采集到的字信息进行加工处理,使字信息成为题录项对应的题录信息;重识别模块,重新识别字符数据采集模块过滤掉的题录信息,该题录信息包含标点符号和空格;数据整理模块,过滤并整合题录信息。本发明通过上述六大模块可以达到自动在封皮上找到所需要的信息,达到了自动化处理要求,这样解放了人力,提高了工作效率。
公开/授权文献
0/0