一种基于OCR的论文封皮自动识别系统及方法

    公开(公告)号:CN105046253A

    公开(公告)日:2015-11-11

    申请号:CN201510354849.3

    申请日:2015-06-24

    IPC分类号: G06K9/20

    CPC分类号: G06K9/2054 G06K2209/01

    摘要: 本发明公开了一种基于OCR的论文封皮自动识别系统,模板设计模块,设计封皮模板并提供信息给模块;图像处理模块,通过OCR对图像进行彩色二值化、去黑边、纠偏处理;字符数据采集模块,利用OCR提取封皮字的信息,为定位区域找到对应的题录信息提供数据支持;数据定位模块,将所述字符数据采集模块采集到的字信息进行加工处理,使字信息成为题录项对应的题录信息;重识别模块,重新识别字符数据采集模块过滤掉的题录信息,该题录信息包含标点符号和空格;数据整理模块,过滤并整合题录信息。本发明通过上述六大模块可以达到自动在封皮上找到所需要的信息,达到了自动化处理要求,这样解放了人力,提高了工作效率。

    一种基于OCR的论文封皮自动识别系统及方法

    公开(公告)号:CN105046253B

    公开(公告)日:2018-05-11

    申请号:CN201510354849.3

    申请日:2015-06-24

    IPC分类号: G06K9/20

    摘要: 本发明公开了一种基于OCR的论文封皮自动识别系统,模板设计模块,设计封皮模板并提供信息给模块;图像处理模块,通过OCR对图像进行彩色二值化、去黑边、纠偏处理;字符数据采集模块,利用OCR提取封皮字的信息,为定位区域找到对应的题录信息提供数据支持;数据定位模块,将所述字符数据采集模块采集到的字信息进行加工处理,使字信息成为题录项对应的题录信息;重识别模块,重新识别字符数据采集模块过滤掉的题录信息,该题录信息包含标点符号和空格;数据整理模块,过滤并整合题录信息。本发明通过上述六大模块可以达到自动在封皮上找到所需要的信息,达到了自动化处理要求,这样解放了人力,提高了工作效率。

    一种基于扫描图像自动去除黑边的处理方法

    公开(公告)号:CN104361335A

    公开(公告)日:2015-02-18

    申请号:CN201410612494.9

    申请日:2014-11-03

    IPC分类号: G06K9/34

    CPC分类号: G06K9/346

    摘要: 本发明公开了一种基于扫描图像自动去除黑边的处理方法,其包括:将扫描后的图像RGB转灰度,并对灰度二值化处理得到二值化图像;对二值化图像进行黑边粗分割;在图像粗分割的基础上进行图像细分割,即对粗分割后的版面进行分析,找出版面四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征;对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体;通过所述版面分析和联通域特征查找黑边坐标,滤掉黑边。本发明解决了不同扫描图像的去黑边问题,方便了软件的后续处理,也给用户的阅读带来了便利。

    一种基于扫描图像自动去除黑边的处理方法

    公开(公告)号:CN104361335B

    公开(公告)日:2017-07-07

    申请号:CN201410612494.9

    申请日:2014-11-03

    IPC分类号: G06K9/34

    摘要: 本发明公开了一种基于扫描图像自动去除黑边的处理方法,该包括:将扫描后的图像RGB转灰度,并对灰度二值化处理得到二值化图像;对二值化图像进行黑边粗分割;在图像粗分割的基础上进行图像细分割,即对粗分割后的版面进行分析,找出版面四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征;对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体;通过所述版面分析和联通域特征查找黑边坐标,滤掉黑边。本发明解决了不同扫描图像的去黑边问题,方便了软件的后续处理,也给用户的阅读带来了便利。