格式文档关键信息块配准及提取的方法及装置

    公开(公告)号:CN106844767B

    公开(公告)日:2019-12-13

    申请号:CN201710100063.8

    申请日:2017-02-23

    Abstract: 本发明涉及一种格式文档关键信息块配准及提取的方法及装置,所述方法:对格式文档的灰度图像进行模式定义;根据标签部件的位置、标签域构建弹性框架;根据标签部件的图像像素占空比,确定弹性框架的配准目标的候选集合;根据标签部件的图像特征对弹性框架进行粗配准,确定价值部件的初始矩形框;根据标签部件的位置对价值部件的初始矩形框进行精确配准,确定价值部件的精准矩形框;根据所述标签部件的位置、字符属性信息及价值部件的精准矩形框确定格式文档关键信息块。本发明格式文档关键信息块配准及提取的方法通过构建弹性框架、多次配准,从而能够准确提取价值部件的精准矩形框内容提取准确,便于数据库的统一管理。

    格式文档关键信息块配准及提取的方法及装置

    公开(公告)号:CN106844767A

    公开(公告)日:2017-06-13

    申请号:CN201710100063.8

    申请日:2017-02-23

    Abstract: 本发明涉及一种格式文档关键信息块配准及提取的方法及装置,所述方法:对格式文档的灰度图像进行模式定义;根据标签部件的位置、标签域构建弹性框架;根据标签部件的图像像素占空比,确定弹性框架的配准目标的候选集合;根据标签部件的图像特征对弹性框架进行粗配准,确定价值部件的初始矩形框;根据标签部件的位置对价值部件的初始矩形框进行精确配准,确定价值部件的精准矩形框;根据所述标签部件的位置、字符属性信息及价值部件的精准矩形框确定格式文档关键信息块。本发明格式文档关键信息块配准及提取的方法通过构建弹性框架、多次配准,从而能够准确提取价值部件的精准矩形框内容提取准确,便于数据库的统一管理。

    基于随机自适应符号稀疏编码的地基云图分类方法

    公开(公告)号:CN103413148B

    公开(公告)日:2017-05-24

    申请号:CN201310389346.0

    申请日:2013-08-30

    Abstract: 本发明公开了一种基于随机自适应符号稀疏编码的地基云图分类方法,该方法包括:对于训练样本集合随机提取样本的局部特征;利用自适应符号稀疏编码对这些局部特征组成的集合进行聚类得到码本;对每个样本随机提取的局部特征,计算其与码本对应的稀疏编码系数,得到该样本随机局部特征的稀疏编码系数组成的矩阵;接下来利用最大化抽取操作得到样本的特征表示;计算测试地基云图的特征表示;利用分类器得到测试地基云图的分类结果。本发明通过随机提取地基云图的局部特征来提高地基云图分类的效率,节省时间开销;同时本发明采用自适应符号稀疏编码的方法来获得码本并计算局部特征的稀疏编码系数,从而可以更好地表示云图中信息,提高分类性能。

    一种基于多实例马尔科夫模型的行为识别方法

    公开(公告)号:CN103544503B

    公开(公告)日:2016-09-21

    申请号:CN201310566006.0

    申请日:2013-11-14

    Abstract: 本发明公开了一种基于多实例马尔科夫模型的行为识别方法。该方法包括以下步骤:对每个视频提取局部特征,用一个局部视频块的特征直方图来表示行为的某个局部运动;通过随机采样的方式得到许多局部视频块,这些局部视频块将形成多个马尔科夫链,这些马尔科夫链表示为某些局部运动在时间上的连续动作;在多实例学习的框架下,模型选择最具有判别性能的马尔科夫链表示行为;测试时,以同样的方式构成多个马尔科夫链表示视频,然后计算出这些马尔科夫链的分数,大于某个阈值为这种行为,反之不属于这种行为。本发明通过多实例马尔科夫模型,达到复杂场景下行为识别的目的,并可以减少对视频的标注。

    一种基于样例迁移学习的人体检测方法

    公开(公告)号:CN103473538B

    公开(公告)日:2016-09-21

    申请号:CN201310432350.0

    申请日:2013-09-22

    Abstract: 本发明公开了一种基于样例迁移学习的人体检测方法,该方法包括以下步骤:提取训练集中正样本和负样本的多维人体特征;利用支持向量机进行训练,得到初始人体检测器;将人体检测器划分为多个小网格,每个网格代表一个小部件,并用相应网格里的权重来表示这个部件;对于网格权重进行更新;采用多尺度滑动框扫描的方式对于待检测图像进行人体检测,得到人体检测结果。本发明中的检测器能够自适应的进行结构调整与测试框里的样例的结构进行匹配,并将匹配的损失计入得分函数中,因此本发明方法能够自适应地对每个样例进行结构迁移,可以处理人体的形变等情况。

    一种交互式的自然场景文本检测方法

    公开(公告)号:CN103336961B

    公开(公告)日:2016-06-29

    申请号:CN201310308807.7

    申请日:2013-07-22

    Abstract: 本发明公开了一种交互式自然场景文本检测方法,该方法首先在场景图片中标记出感兴趣文本所在区域,即在文本上画一条线;根据这条线从原图中选取一个扩展区域,在扩展区域中进行边缘检测,对边缘检测结果进行连通域标记,再对标记结果的边界进行投影得到边缘文本区域;然后对这个区域分块二值化、连通域标记和投影操作,得到粗略文本区域;最后对粗略文本区域进行分块二值化和反色的二值化操作,对两种二值化结果分别进行连通域标记、去除各种噪声、边界投影和连通域数目确定,根据两种二值图像的连通域数目确定图片极性,再对连通域进行融合得到精确的文本区域。本方法具有局部空间自适应性,对自然场景图片中背景复杂的文本块有很好的检测效果。

    一种基于域鲁棒卷积特征学习的交叉视角人脸识别方法

    公开(公告)号:CN104318215A

    公开(公告)日:2015-01-28

    申请号:CN201410583974.7

    申请日:2014-10-27

    CPC classification number: G06K9/00221 G06K9/6232

    Abstract: 本发明一种基于域鲁棒卷积特征学习的交叉视角人脸识别方法,包括步骤S1:从源域和目标域人脸集中采集多个人脸图像组成虚拟域人脸集;步骤S2:训练出源域、虚拟域和目标域的卷积深度神经网络;分别组成源域、目标域人脸集的人脸图像的卷积特征;步骤S3:建立源视角映射矩阵和目标视角映射矩阵,获得源域、目标域人脸集的人脸图像的卷积特征在映射空间中相应的源域、目标域新人脸特征值;步骤S4:优化源视角映射矩阵和目标视角映射矩阵;步骤S5:计算测试人脸图片的卷积特征并输入映射矩阵,得到并在一个新人脸特征值与多个新人脸特征之间的多个距离中选择最小距离对应的测试源视角人脸图像的身份作为测试目标视角人脸图像的身份。

    一种基于鲁棒相对属性的行为识别方法

    公开(公告)号:CN103345623A

    公开(公告)日:2013-10-09

    申请号:CN201310290428.X

    申请日:2013-07-11

    Abstract: 本发明公开了一种基于鲁棒相对属性的行为识别方法。该方法包括以下步骤:提取视频样本库中每个动作视频样本的特征向量;设定对应于多种人体行为的多个人体运动属性,以及在每个人体运动属性下,每两个代表人体行为的动作视频,即动作视频对之间的关系;将所述动作视频对之间的关系作为输入,利用排序支持向量机进行训练,得到训练模型;利用梯度下降法求解所述排序支持向量机,得到所述排序支持向量机的参数向量,进而得到最优训练模型;利用得到的最优训练模型对每个待测试的动作视频进行人体行为识别,得到人体行为识别结果。实验证明,本发明方法能够提高人体行为识别的鲁棒性。

    一种实现场景图像的分类方法

    公开(公告)号:CN101814147B

    公开(公告)日:2012-04-25

    申请号:CN201010144474.5

    申请日:2010-04-12

    Abstract: 本发明是一种实现场景图像的分类方法,该方法采用两级分类器对场景图像进行分类,第一级分类器利用全局结构信息特征得到候选类别,并通过分类结果判定相似类别对,第二级分类器则利用局部纹理信息特征区分相似类别,采用分类器的级联综合利用场景图像的全局结构信息特征和局部纹理信息特征,使得该方法做到不同场景类别鲁棒分类,相似场景类别有效区分。

Patent Agency Ranking