-
公开(公告)号:CN105046253A
公开(公告)日:2015-11-11
申请号:CN201510354849.3
申请日:2015-06-24
申请人: 山西同方知网数字出版技术有限公司
IPC分类号: G06K9/20
CPC分类号: G06K9/2054 , G06K2209/01
摘要: 本发明公开了一种基于OCR的论文封皮自动识别系统,模板设计模块,设计封皮模板并提供信息给模块;图像处理模块,通过OCR对图像进行彩色二值化、去黑边、纠偏处理;字符数据采集模块,利用OCR提取封皮字的信息,为定位区域找到对应的题录信息提供数据支持;数据定位模块,将所述字符数据采集模块采集到的字信息进行加工处理,使字信息成为题录项对应的题录信息;重识别模块,重新识别字符数据采集模块过滤掉的题录信息,该题录信息包含标点符号和空格;数据整理模块,过滤并整合题录信息。本发明通过上述六大模块可以达到自动在封皮上找到所需要的信息,达到了自动化处理要求,这样解放了人力,提高了工作效率。
-
公开(公告)号:CN105046253B
公开(公告)日:2018-05-11
申请号:CN201510354849.3
申请日:2015-06-24
申请人: 山西同方知网数字出版技术有限公司
IPC分类号: G06K9/20
摘要: 本发明公开了一种基于OCR的论文封皮自动识别系统,模板设计模块,设计封皮模板并提供信息给模块;图像处理模块,通过OCR对图像进行彩色二值化、去黑边、纠偏处理;字符数据采集模块,利用OCR提取封皮字的信息,为定位区域找到对应的题录信息提供数据支持;数据定位模块,将所述字符数据采集模块采集到的字信息进行加工处理,使字信息成为题录项对应的题录信息;重识别模块,重新识别字符数据采集模块过滤掉的题录信息,该题录信息包含标点符号和空格;数据整理模块,过滤并整合题录信息。本发明通过上述六大模块可以达到自动在封皮上找到所需要的信息,达到了自动化处理要求,这样解放了人力,提高了工作效率。
-
公开(公告)号:CN104361335A
公开(公告)日:2015-02-18
申请号:CN201410612494.9
申请日:2014-11-03
申请人: 山西同方知网数字出版技术有限公司
IPC分类号: G06K9/34
CPC分类号: G06K9/346
摘要: 本发明公开了一种基于扫描图像自动去除黑边的处理方法,其包括:将扫描后的图像RGB转灰度,并对灰度二值化处理得到二值化图像;对二值化图像进行黑边粗分割;在图像粗分割的基础上进行图像细分割,即对粗分割后的版面进行分析,找出版面四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征;对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体;通过所述版面分析和联通域特征查找黑边坐标,滤掉黑边。本发明解决了不同扫描图像的去黑边问题,方便了软件的后续处理,也给用户的阅读带来了便利。
-
公开(公告)号:CN104361335B
公开(公告)日:2017-07-07
申请号:CN201410612494.9
申请日:2014-11-03
申请人: 山西同方知网数字出版技术有限公司
IPC分类号: G06K9/34
摘要: 本发明公开了一种基于扫描图像自动去除黑边的处理方法,该包括:将扫描后的图像RGB转灰度,并对灰度二值化处理得到二值化图像;对二值化图像进行黑边粗分割;在图像粗分割的基础上进行图像细分割,即对粗分割后的版面进行分析,找出版面四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征;对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体;通过所述版面分析和联通域特征查找黑边坐标,滤掉黑边。本发明解决了不同扫描图像的去黑边问题,方便了软件的后续处理,也给用户的阅读带来了便利。
-
-
-