-
公开(公告)号:CN111583156B
公开(公告)日:2023-06-23
申请号:CN202010403455.3
申请日:2020-05-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像底纹去除方法及系统,所述去除方法包括:对原始文档图像进行二值化处理,得到二值化图像;提取二值化图像的边缘,得到边缘图像;融合边缘图像的设定距离的边缘,得到融合图像;根据融合图像及边缘图像,得到底纹纹理图;将原始文档图像等分成多个图像块;从图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;计算各第一像素点的像素值的均值,得到图像块的纹理均值;计算像素点的像素值与纹理均值之间的距离值;当距离值小于或等于颜色距离阈值,则将像素点对应的二值化图像中的像素点置零,得到二值化结果图像,在去除底纹的同时能有效的保留文档中被底纹干扰的文本信息。
-
公开(公告)号:CN110059572B
公开(公告)日:2021-08-10
申请号:CN201910222318.7
申请日:2019-03-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于文本图像识别技术领域,具体涉及一种基于单字匹配的文档图像中文关键词检测方法、系统,旨在解决解决文档图像图像质量不稳定及汉字排列多样性带来的中文关键词识别的准确度和鲁棒性不足的问题,本发明方法包括:对文档图像进行二值化处理得到第一图像;进行字符检测得到第一候选字符集合;对第一候选字符集合进行过滤得到第二候选字符集合、第一噪声候选字符集合;从第一噪声候选字符集合筛选字符并添加至第二候选字符集合,得到第三候选字符集合;进行候选字符组合得到第一候选词集合;进行丢失字符的二次检测得到第二候选词集合;基于代价函数,选择最终的关键词检测结果。本发明提高了文档关键词识别的准确度,具有高鲁棒性。
-
公开(公告)号:CN111611933A
公开(公告)日:2020-09-01
申请号:CN202010441086.7
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像的信息提取方法及系统,所述提取方法包括:基于全卷积神经网络,根据待识别文档图像,得到字符感知响应图;采用分水岭算法,对字符感知响应图进行分割,得到多个分割图像;通过连通域提取方法,对各分割图像进行字符提取,得到各分割图像中的字符;基于深度神经网络的字符识别模型,对各字符进行识别,确定各字符的位置信息;根据位置信息,对字符进行合并,得到待识别图像的识别信息。本发明通过全卷积神经网络、分水岭算法、连通域提取方法,确定待识别文档图像的各分割图像中的字符,并基于深度神经网络的字符识别模型,确定各字符的位置信息;进而根据位置信息对字符进行合并,可准确得到待识别图像的识别信息。
-
公开(公告)号:CN111198964A
公开(公告)日:2020-05-26
申请号:CN202010026336.0
申请日:2020-01-10
Applicant: 中国科学院自动化研究所
IPC: G06F16/583 , G06N3/04
Abstract: 本发明涉及一种图像检索方法及系统,所述检索方法包括:对训练图像集标记类别,得到多个标记图像;根据各所述标记图像,进行建模,得到基于对抗注意力机制的卷积神经网络模型;获取参考图库的各参考图像;通过所述卷积神经网络模型,分别提取待检索图像及各参考图像对应的全局特征;根据所述待检索图像及各参考图像对应的全局特征,确定检索结果;所述检索结果为选取与所述待检索图像不相似的参考图像,作为推荐图像。本发明根据训练图像集建模,得到基于对抗注意力机制的卷积神经网络模型,可直接提取待检索图像及各参考图像对应的全局特征;进而可根据待检索图像及各参考图像对应的全局特征,准确得到与所述待检索图像不相似的推荐图像。
-
公开(公告)号:CN110097059A
公开(公告)日:2019-08-06
申请号:CN201910222323.8
申请日:2019-03-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于图像处理领域,具体涉及一种基于生成对抗网络的文档图像二值化方法、系统、装置,旨在为了解决解决现有二值化方法在文档图片的图像质量参差不齐的情况下其二值化准确度不稳定,鲁棒性较差的问题。本发明方法包括:对原始文档图像进行切分;分基于第一卷积神经网络分别对切分图像、归一化后的原始文档图像进行二值化处理;将得到的二值化图像分别通过拼接、缩放生成原始文档图像尺寸,并与原始文档图像的灰度图进行合并,进行图片切分后通过第二卷积神经网络进二值化,并合并得到的二值化图像块得到最终的二值化图。本发明对于多种类型文档的拍照文档图像可以获取准确度较高的二值化图像,且具有较高的稳定性,鲁棒性强。
-
公开(公告)号:CN106203434B
公开(公告)日:2019-07-19
申请号:CN201610534712.0
申请日:2016-07-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于笔画结构对称性的文档图像二值化方法。其中,所述方法包括:确定文档图像的梯度图像,其中,所述文档图像为灰度图像;利用最大类间方差法,对所述梯度图像进行全局二值化处理;根据文字笔画的宽度和局部区域内梯度方向对称性,去除全局二值化处理后图像中的非笔画梯度噪声,确定局部梯度方向对称的梯度图像;基于所述局部梯度方向对称的梯度图像,确定结构对称元素图像;根据所述结构对称元素图像中前景元素的局部密度,滤除噪声,并结合所述文档图像进行基于投票策略的局部二值化。通过本发明实施例解决了如何增强对文档图像文字提取的适应性的技术问题。
-
公开(公告)号:CN104573663B
公开(公告)日:2017-12-05
申请号:CN201510023529.X
申请日:2015-01-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于鉴别性笔画库的英文场景文字识别方法,其包括步骤:1、基于关键点标注的笔画子检测器学习;2、笔画子检测器响应区域的界定;3、鉴别性笔画选取;4、特征提取和文字分类器的训练。本发明参考物体库的思路,通过标记的关键点来为笔画子检测器收集训练样本,并且为每一个文字笔画子检测器设定特定的响应区域,既可以减轻特征抽取的计算负担,又增强了文字分类器的鉴别能力。
-
公开(公告)号:CN104537362B
公开(公告)日:2017-12-01
申请号:CN201510022065.0
申请日:2015-01-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于域自适应的英文场景文字识别方法,其包括步骤:1、建立位置嵌入词典;2)基于位置嵌入词典的编码和抽取;3)中间域词典的学习;4)文字分类器的训练和测试。本发明方法先通过建立位置嵌入词典解决传统图像金字塔无法应用于场景文字识别的问题,之后通过非监督词典学习方法对训练域和目标域的分布差异进行内插,从而实现域自适应的英文场景文字识别。
-
公开(公告)号:CN103400160B
公开(公告)日:2017-03-01
申请号:CN201310364990.2
申请日:2013-08-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种零训练样本行为识别方法,该方法包括以下步骤:提取每个动作视频样本的特征向量;设定多个人体运动属性以及每个人体运动属性下动作视频对之间的关系;将动作视频对关系作为输入,利用排序支持向量机进行训练;利用输出的排序分数,对每一类有训练样本的人体行为拟合得到混合高斯模型;利用迁移学习获得零训练样本人体行为类别的混合高斯模型;提取测试视频样本的特征向量;利用最大后验概率原则,判断测试视频样本中零训练样本人体行为所属的类别。本发明通过利用混合高斯模型拟合排序分数,达到行为识别的目的,并通过最大后验判断所属类别,从而提高行为识别的鲁棒性。
-
公开(公告)号:CN106203434A
公开(公告)日:2016-12-07
申请号:CN201610534712.0
申请日:2016-07-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于笔画结构对称性的文档图像二值化方法。其中,所述方法包括:确定文档图像的梯度图像,其中,所述文档图像为灰度图像;利用最大类间方差法,对所述梯度图像进行全局二值化处理;根据文字笔画的宽度和局部区域内梯度方向对称性,去除全局二值化处理后图像中的非笔画梯度噪声,确定局部梯度方向对称的梯度图像;基于所述局部梯度方向对称的梯度图像,确定结构对称元素图像;根据所述结构对称元素图像中前景元素的局部密度,滤除噪声,并结合所述文档图像进行基于投票策略的局部二值化。通过本发明实施例解决了如何增强对文档图像文字提取的适应性的技术问题。
-
-
-
-
-
-
-
-
-