-
公开(公告)号:CN101872475B
公开(公告)日:2012-03-28
申请号:CN200910082084.7
申请日:2009-04-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明为一种扫描文档图像配准的方法,步骤如下:由改进的特征点检测、旋转参数粗估计、特征点粗匹配、误匹配特征点剔除、精细匹配共五个步骤:对于标准扫描文档图像和待匹配扫描文档图像采用改进的特征点检测算法检测特征点,由特征点的位置估计待匹配扫描文档图像相对与标准扫描文档图像的粗步旋转角度,对于标准图像和经过粗步旋转后的扫描文档图像中的特征点用归一化相关法计算匹配特征点对,并用改进随机采样一致性鲁棒算法剔除误匹配,通过八邻域搜索得到精确的匹配点对的位置,计算标准扫描文档图像与粗步旋转后的待匹配扫描文档图像间的匹配参数,将参数作用于粗步旋转后的待匹配扫描文档图像得到配准图像。
-
公开(公告)号:CN102332097A
公开(公告)日:2012-01-25
申请号:CN201110322549.9
申请日:2011-10-21
Applicant: 中国科学院自动化研究所
IPC: G06K9/20
Abstract: 本发明公开了一种基于图割的复杂背景文本图像分割方法,其包括步骤:1)将原始文本块图像粗分为子图;2)通过估计每个子图的极性,最终决定整个文本块图像的极性;3)根据文本块图像的极性,结合字符笔画的固有特征,自动提供一些置信度较高的前景背景点作为图割的硬约束;4)对子图施加相应的软约束,用图割将硬约束传播到整个子图,进而分割子图;5)将分割的子图合并获得整体的文本分割图像。本发明方法采用分-合的技术,具有局部空间自适应性,从而可以应对背景不均匀的复杂背景文本块图像;同时,本方法自动为图割提供硬约束,结合软约束将硬约束扩展到整幅子图,因此对背景复杂的文本图像可以取得较好的分割效果。
-
公开(公告)号:CN101833664A
公开(公告)日:2010-09-15
申请号:CN201010151779.9
申请日:2010-04-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明是基于稀疏表达的视频图像文字检测方法,步骤S1,对视频序列重采样,获得并将彩色视频图像进行灰度变换和多尺度变换得到多尺度灰度图像;步骤S2,对多尺度灰度图像用改进Sobel算子进行边缘检测和形态学闭运算,获得并对边缘图像进行边缘密度过滤;通过连通域分析、规则分析获得候选文字区域;步骤S3,对候选文字区域通过垂直投影和水平投影,再对垂直投影图像和水平投影像进行切分得到候选文字行,通过滑动窗口将候选文字行切分为小区域,对小区域提取边缘特征,采用基于稀疏表达的分类方法对每一个小区域分别进行分类,判断小区域是否为文字区域,根据小区域的判断结果,对候选文字行进行判断,得到并输出最终的文字行区域。
-
公开(公告)号:CN101377847B
公开(公告)日:2010-06-02
申请号:CN200710121080.6
申请日:2007-08-29
Applicant: 中国科学院自动化研究所
IPC: G06T3/00
Abstract: 本发明涉及图像处理学科技术领域,特别是一种通用型文档图像的配准及特征点选取方法。该方法以图像轮廓作为文档图像配准特征,并以轮廓点表示文档图像轮廓。方法过程为:首先,以文档图像轮廓点为候选点,通过特征点选择方法分别在参考图像和配准图像中自动选取若干点作为图像配准特征点;然后,以射影变换不变量作为相似度量,在特征点集中寻找若干个候选的匹配点集对,并计算出点集对对应的几何变换作为候选配准变换;最后,以轮廓匹配度为度量,从候选配准变换中寻找最优匹配的变换,作为最终配准变换,对文档图像进行配准。该方法能胜任不同类型文档图像的配准,并且在效率和鲁棒性上表现良好。
-
公开(公告)号:CN111583156B
公开(公告)日:2023-06-23
申请号:CN202010403455.3
申请日:2020-05-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像底纹去除方法及系统,所述去除方法包括:对原始文档图像进行二值化处理,得到二值化图像;提取二值化图像的边缘,得到边缘图像;融合边缘图像的设定距离的边缘,得到融合图像;根据融合图像及边缘图像,得到底纹纹理图;将原始文档图像等分成多个图像块;从图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;计算各第一像素点的像素值的均值,得到图像块的纹理均值;计算像素点的像素值与纹理均值之间的距离值;当距离值小于或等于颜色距离阈值,则将像素点对应的二值化图像中的像素点置零,得到二值化结果图像,在去除底纹的同时能有效的保留文档中被底纹干扰的文本信息。
-
公开(公告)号:CN110059572B
公开(公告)日:2021-08-10
申请号:CN201910222318.7
申请日:2019-03-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于文本图像识别技术领域,具体涉及一种基于单字匹配的文档图像中文关键词检测方法、系统,旨在解决解决文档图像图像质量不稳定及汉字排列多样性带来的中文关键词识别的准确度和鲁棒性不足的问题,本发明方法包括:对文档图像进行二值化处理得到第一图像;进行字符检测得到第一候选字符集合;对第一候选字符集合进行过滤得到第二候选字符集合、第一噪声候选字符集合;从第一噪声候选字符集合筛选字符并添加至第二候选字符集合,得到第三候选字符集合;进行候选字符组合得到第一候选词集合;进行丢失字符的二次检测得到第二候选词集合;基于代价函数,选择最终的关键词检测结果。本发明提高了文档关键词识别的准确度,具有高鲁棒性。
-
公开(公告)号:CN111611933A
公开(公告)日:2020-09-01
申请号:CN202010441086.7
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像的信息提取方法及系统,所述提取方法包括:基于全卷积神经网络,根据待识别文档图像,得到字符感知响应图;采用分水岭算法,对字符感知响应图进行分割,得到多个分割图像;通过连通域提取方法,对各分割图像进行字符提取,得到各分割图像中的字符;基于深度神经网络的字符识别模型,对各字符进行识别,确定各字符的位置信息;根据位置信息,对字符进行合并,得到待识别图像的识别信息。本发明通过全卷积神经网络、分水岭算法、连通域提取方法,确定待识别文档图像的各分割图像中的字符,并基于深度神经网络的字符识别模型,确定各字符的位置信息;进而根据位置信息对字符进行合并,可准确得到待识别图像的识别信息。
-
公开(公告)号:CN111198964A
公开(公告)日:2020-05-26
申请号:CN202010026336.0
申请日:2020-01-10
Applicant: 中国科学院自动化研究所
IPC: G06F16/583 , G06N3/04
Abstract: 本发明涉及一种图像检索方法及系统,所述检索方法包括:对训练图像集标记类别,得到多个标记图像;根据各所述标记图像,进行建模,得到基于对抗注意力机制的卷积神经网络模型;获取参考图库的各参考图像;通过所述卷积神经网络模型,分别提取待检索图像及各参考图像对应的全局特征;根据所述待检索图像及各参考图像对应的全局特征,确定检索结果;所述检索结果为选取与所述待检索图像不相似的参考图像,作为推荐图像。本发明根据训练图像集建模,得到基于对抗注意力机制的卷积神经网络模型,可直接提取待检索图像及各参考图像对应的全局特征;进而可根据待检索图像及各参考图像对应的全局特征,准确得到与所述待检索图像不相似的推荐图像。
-
公开(公告)号:CN110097059A
公开(公告)日:2019-08-06
申请号:CN201910222323.8
申请日:2019-03-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于图像处理领域,具体涉及一种基于生成对抗网络的文档图像二值化方法、系统、装置,旨在为了解决解决现有二值化方法在文档图片的图像质量参差不齐的情况下其二值化准确度不稳定,鲁棒性较差的问题。本发明方法包括:对原始文档图像进行切分;分基于第一卷积神经网络分别对切分图像、归一化后的原始文档图像进行二值化处理;将得到的二值化图像分别通过拼接、缩放生成原始文档图像尺寸,并与原始文档图像的灰度图进行合并,进行图片切分后通过第二卷积神经网络进二值化,并合并得到的二值化图像块得到最终的二值化图。本发明对于多种类型文档的拍照文档图像可以获取准确度较高的二值化图像,且具有较高的稳定性,鲁棒性强。
-
公开(公告)号:CN106203434B
公开(公告)日:2019-07-19
申请号:CN201610534712.0
申请日:2016-07-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于笔画结构对称性的文档图像二值化方法。其中,所述方法包括:确定文档图像的梯度图像,其中,所述文档图像为灰度图像;利用最大类间方差法,对所述梯度图像进行全局二值化处理;根据文字笔画的宽度和局部区域内梯度方向对称性,去除全局二值化处理后图像中的非笔画梯度噪声,确定局部梯度方向对称的梯度图像;基于所述局部梯度方向对称的梯度图像,确定结构对称元素图像;根据所述结构对称元素图像中前景元素的局部密度,滤除噪声,并结合所述文档图像进行基于投票策略的局部二值化。通过本发明实施例解决了如何增强对文档图像文字提取的适应性的技术问题。
-
-
-
-
-
-
-
-
-