基于局部梯度分布的拍摄图像优选方法及装置

    公开(公告)号:CN108805033A

    公开(公告)日:2018-11-13

    申请号:CN201810492704.3

    申请日:2018-05-22

    Abstract: 本发明属于模式识别领域,具体涉及一种基于局部梯度分布的拍摄图像优选方法及装置,旨在解决如何在获取的多张目标文档的图像中快速准确地选择出最清晰的一张图像的问题。为此目的,本发明提供的优选方法包括:获取目标文档的多张尺寸一致的拍摄图像,并设置多个大小一致的第一候选框;计算每个第一候选框内图像的第一边缘信息强度,根据第一边缘信息强度的降序选取第二候选框;对目标文档的每张拍摄图像,计算每张所述拍摄图像的第一评估值和第二评估值;从第一评估值最高的图像和第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像。本发明提供的优选方法适用于多种类型的文档图像,对于文档图像识别性能的提高有着重要意义。

    多语言场景字符识别方法及识别系统

    公开(公告)号:CN106570521A

    公开(公告)日:2017-04-19

    申请号:CN201610924239.7

    申请日:2016-10-24

    Abstract: 本发明涉及一种多语言场景字符识别方法及识别系统。其中,该方法可以包括:确定场景字符图像中字符的语言类型;根据字符的语言类型,确定深度卷积神经网络模型;利用深度卷积神经网络模型,来提取场景字符图像的卷积层特征;基于卷积层特征,建立空间金字塔模型;利用高斯模型在空间金字塔模型上对每一空间区域进行高阶编码;将高阶编码后的结果拼接起来,作为场景字符描述子;利用分类器对场景字符描述子进行分类,以实现多语言场景字符的识别。本发明实施例对多语言的场景字符图像具有很好的识别效果,是一种通用的字符识别方法,对多语言场景文字识别具有良好的适应性。

    格式文档关键信息块配准及提取的方法及装置

    公开(公告)号:CN106844767B

    公开(公告)日:2019-12-13

    申请号:CN201710100063.8

    申请日:2017-02-23

    Abstract: 本发明涉及一种格式文档关键信息块配准及提取的方法及装置,所述方法:对格式文档的灰度图像进行模式定义;根据标签部件的位置、标签域构建弹性框架;根据标签部件的图像像素占空比,确定弹性框架的配准目标的候选集合;根据标签部件的图像特征对弹性框架进行粗配准,确定价值部件的初始矩形框;根据标签部件的位置对价值部件的初始矩形框进行精确配准,确定价值部件的精准矩形框;根据所述标签部件的位置、字符属性信息及价值部件的精准矩形框确定格式文档关键信息块。本发明格式文档关键信息块配准及提取的方法通过构建弹性框架、多次配准,从而能够准确提取价值部件的精准矩形框内容提取准确,便于数据库的统一管理。

    格式文档关键信息块配准及提取的方法及装置

    公开(公告)号:CN106844767A

    公开(公告)日:2017-06-13

    申请号:CN201710100063.8

    申请日:2017-02-23

    Abstract: 本发明涉及一种格式文档关键信息块配准及提取的方法及装置,所述方法:对格式文档的灰度图像进行模式定义;根据标签部件的位置、标签域构建弹性框架;根据标签部件的图像像素占空比,确定弹性框架的配准目标的候选集合;根据标签部件的图像特征对弹性框架进行粗配准,确定价值部件的初始矩形框;根据标签部件的位置对价值部件的初始矩形框进行精确配准,确定价值部件的精准矩形框;根据所述标签部件的位置、字符属性信息及价值部件的精准矩形框确定格式文档关键信息块。本发明格式文档关键信息块配准及提取的方法通过构建弹性框架、多次配准,从而能够准确提取价值部件的精准矩形框内容提取准确,便于数据库的统一管理。

    一种交互式的自然场景文本检测方法

    公开(公告)号:CN103336961B

    公开(公告)日:2016-06-29

    申请号:CN201310308807.7

    申请日:2013-07-22

    Abstract: 本发明公开了一种交互式自然场景文本检测方法,该方法首先在场景图片中标记出感兴趣文本所在区域,即在文本上画一条线;根据这条线从原图中选取一个扩展区域,在扩展区域中进行边缘检测,对边缘检测结果进行连通域标记,再对标记结果的边界进行投影得到边缘文本区域;然后对这个区域分块二值化、连通域标记和投影操作,得到粗略文本区域;最后对粗略文本区域进行分块二值化和反色的二值化操作,对两种二值化结果分别进行连通域标记、去除各种噪声、边界投影和连通域数目确定,根据两种二值图像的连通域数目确定图片极性,再对连通域进行融合得到精确的文本区域。本方法具有局部空间自适应性,对自然场景图片中背景复杂的文本块有很好的检测效果。

    一种基于图割的复杂背景文本图像分割方法

    公开(公告)号:CN102332097A

    公开(公告)日:2012-01-25

    申请号:CN201110322549.9

    申请日:2011-10-21

    Abstract: 本发明公开了一种基于图割的复杂背景文本图像分割方法,其包括步骤:1)将原始文本块图像粗分为子图;2)通过估计每个子图的极性,最终决定整个文本块图像的极性;3)根据文本块图像的极性,结合字符笔画的固有特征,自动提供一些置信度较高的前景背景点作为图割的硬约束;4)对子图施加相应的软约束,用图割将硬约束传播到整个子图,进而分割子图;5)将分割的子图合并获得整体的文本分割图像。本发明方法采用分-合的技术,具有局部空间自适应性,从而可以应对背景不均匀的复杂背景文本块图像;同时,本方法自动为图割提供硬约束,结合软约束将硬约束扩展到整幅子图,因此对背景复杂的文本图像可以取得较好的分割效果。

    文档图像的信息提取方法及系统

    公开(公告)号:CN111611933A

    公开(公告)日:2020-09-01

    申请号:CN202010441086.7

    申请日:2020-05-22

    Abstract: 本发明涉及一种文档图像的信息提取方法及系统,所述提取方法包括:基于全卷积神经网络,根据待识别文档图像,得到字符感知响应图;采用分水岭算法,对字符感知响应图进行分割,得到多个分割图像;通过连通域提取方法,对各分割图像进行字符提取,得到各分割图像中的字符;基于深度神经网络的字符识别模型,对各字符进行识别,确定各字符的位置信息;根据位置信息,对字符进行合并,得到待识别图像的识别信息。本发明通过全卷积神经网络、分水岭算法、连通域提取方法,确定待识别文档图像的各分割图像中的字符,并基于深度神经网络的字符识别模型,确定各字符的位置信息;进而根据位置信息对字符进行合并,可准确得到待识别图像的识别信息。

    基于笔画结构对称性的文档图像二值化方法

    公开(公告)号:CN106203434B

    公开(公告)日:2019-07-19

    申请号:CN201610534712.0

    申请日:2016-07-08

    Abstract: 本发明公开了一种基于笔画结构对称性的文档图像二值化方法。其中,所述方法包括:确定文档图像的梯度图像,其中,所述文档图像为灰度图像;利用最大类间方差法,对所述梯度图像进行全局二值化处理;根据文字笔画的宽度和局部区域内梯度方向对称性,去除全局二值化处理后图像中的非笔画梯度噪声,确定局部梯度方向对称的梯度图像;基于所述局部梯度方向对称的梯度图像,确定结构对称元素图像;根据所述结构对称元素图像中前景元素的局部密度,滤除噪声,并结合所述文档图像进行基于投票策略的局部二值化。通过本发明实施例解决了如何增强对文档图像文字提取的适应性的技术问题。

    一种基于鉴别性笔画库的英文场景文字识别方法

    公开(公告)号:CN104573663B

    公开(公告)日:2017-12-05

    申请号:CN201510023529.X

    申请日:2015-01-16

    Abstract: 本发明是一种基于鉴别性笔画库的英文场景文字识别方法,其包括步骤:1、基于关键点标注的笔画子检测器学习;2、笔画子检测器响应区域的界定;3、鉴别性笔画选取;4、特征提取和文字分类器的训练。本发明参考物体库的思路,通过标记的关键点来为笔画子检测器收集训练样本,并且为每一个文字笔画子检测器设定特定的响应区域,既可以减轻特征抽取的计算负担,又增强了文字分类器的鉴别能力。

Patent Agency Ranking