-
公开(公告)号:CN104573663B
公开(公告)日:2017-12-05
申请号:CN201510023529.X
申请日:2015-01-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于鉴别性笔画库的英文场景文字识别方法,其包括步骤:1、基于关键点标注的笔画子检测器学习;2、笔画子检测器响应区域的界定;3、鉴别性笔画选取;4、特征提取和文字分类器的训练。本发明参考物体库的思路,通过标记的关键点来为笔画子检测器收集训练样本,并且为每一个文字笔画子检测器设定特定的响应区域,既可以减轻特征抽取的计算负担,又增强了文字分类器的鉴别能力。
-
公开(公告)号:CN104537362B
公开(公告)日:2017-12-01
申请号:CN201510022065.0
申请日:2015-01-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于域自适应的英文场景文字识别方法,其包括步骤:1、建立位置嵌入词典;2)基于位置嵌入词典的编码和抽取;3)中间域词典的学习;4)文字分类器的训练和测试。本发明方法先通过建立位置嵌入词典解决传统图像金字塔无法应用于场景文字识别的问题,之后通过非监督词典学习方法对训练域和目标域的分布差异进行内插,从而实现域自适应的英文场景文字识别。
-
公开(公告)号:CN103400160B
公开(公告)日:2017-03-01
申请号:CN201310364990.2
申请日:2013-08-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种零训练样本行为识别方法,该方法包括以下步骤:提取每个动作视频样本的特征向量;设定多个人体运动属性以及每个人体运动属性下动作视频对之间的关系;将动作视频对关系作为输入,利用排序支持向量机进行训练;利用输出的排序分数,对每一类有训练样本的人体行为拟合得到混合高斯模型;利用迁移学习获得零训练样本人体行为类别的混合高斯模型;提取测试视频样本的特征向量;利用最大后验概率原则,判断测试视频样本中零训练样本人体行为所属的类别。本发明通过利用混合高斯模型拟合排序分数,达到行为识别的目的,并通过最大后验判断所属类别,从而提高行为识别的鲁棒性。
-
公开(公告)号:CN106203434A
公开(公告)日:2016-12-07
申请号:CN201610534712.0
申请日:2016-07-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于笔画结构对称性的文档图像二值化方法。其中,所述方法包括:确定文档图像的梯度图像,其中,所述文档图像为灰度图像;利用最大类间方差法,对所述梯度图像进行全局二值化处理;根据文字笔画的宽度和局部区域内梯度方向对称性,去除全局二值化处理后图像中的非笔画梯度噪声,确定局部梯度方向对称的梯度图像;基于所述局部梯度方向对称的梯度图像,确定结构对称元素图像;根据所述结构对称元素图像中前景元素的局部密度,滤除噪声,并结合所述文档图像进行基于投票策略的局部二值化。通过本发明实施例解决了如何增强对文档图像文字提取的适应性的技术问题。
-
公开(公告)号:CN103336972A
公开(公告)日:2013-10-02
申请号:CN201310314199.0
申请日:2013-07-24
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于完备化局部三值模式的地基云图分类方法,该方法包括以下步骤:将每个训练样本的局部信息分解为局部差值向量以及中心像素;将每个局部差值向量分解为符号向量和幅值向量的乘积;对于符号向量、幅值向量及中心像素采用三值模式编码,并分别计算其旋转不变一致性特征;对旋转不变一致性特征进行融合,得到训练样本的最终特征表示;计算测试地基云图的最终特征表示;基于两者的最终特征表示,应用最近邻分类器得到测试地基云图的分类结果。本发明通过把图像的局部信息从符号、幅值和中心像素值三个方面考虑,采用局部三值模式进行编码,最后融合得到图像最终的特征表示,这使得本发明可以获得更好的噪声鲁棒性和分类准确性。
-
公开(公告)号:CN103226713A
公开(公告)日:2013-07-31
申请号:CN201310181275.5
申请日:2013-05-16
Applicant: 中国科学院自动化研究所
IPC: G06K9/64
Abstract: 本发明公开了一种多视角行为识别方法。该方法包括以下步骤:对每个视角的动作视频样本提取其局部和全局特征,并把每个动作视频样本表示成为一个特征向量;对源视角和目标视角的动作视频样本的变换矩阵进行初始化;然后在信息论的框架下求得源视角和目标视角的动作视频样本的变换矩阵;根据两个视角的动作视频样本的变换矩阵求得虚拟视角核;然后求得每个动作视频样本之间的相似度;最后使用支持向量机分类器对测试动作视频进行分类。本发明通过连接在源视角和目标视角的连续通路达到多视角行为识别的目的;通过虚拟视角核计算得到的相似度矩阵能够作为任何基于核分类器的输入。
-
公开(公告)号:CN101894264B
公开(公告)日:2012-11-14
申请号:CN201010195097.8
申请日:2010-05-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明为一种基于短语包模型的图像类别标注方法,该方法在现有的字包模型表示的基础上,引入视觉字之间的位置信息,提出了短语包模型表示策略。本发明有效的解决了传统字包模型缺乏位置信息导致判别性不足与加入分块的位置信息后对目标位移敏感之间的矛盾;使得图像在引入视觉字之间的位置信息而增加了判别性的同时,消除了对目标在图像中位移的敏感性,有效地提高了图像类别标注系统的性能,具有重要的应用价值。
-
公开(公告)号:CN102156871A
公开(公告)日:2011-08-17
申请号:CN201010112518.6
申请日:2010-02-12
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明为基于类别相关的码本和分类器投票策略的图像分类方法,首先图像数据集预处理模块将图像表示为局部显著区域图像块的集合;类别相关的码本生成模块生成类别相关的码本;图像向量化模块根据类别相关的码本,将图像表示为图像向量,类别相关分类器训练模块选择其中的训练图像向量和训练图像对应的类别标签训练任意两个类别之间的分类器;最后,基于分类器投票策略的测试图像分类模块根据各个分类器的投票结果,确定测试图像的类别标签。类别相关码本生成模块有效地解决了码本过大导致维数灾难与码本过小判别性不足的矛盾;同时类别相关的分类器训练模块也摆脱了多类别分类中样本不均衡产生的问题,提高了分类性能。
-
公开(公告)号:CN101826161A
公开(公告)日:2010-09-08
申请号:CN201010143009.X
申请日:2010-04-09
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明为一种基于局部近邻稀疏表示的目标识别方法,其输入样本模块从数据库中输出并且由本单位化模块c类训练样本集和测试样本集进行单位化,获得单位化后的训练样本集A和测试样本集Y;局部近邻计算模块对于单位化后的测试样本集Y中的每个测试样本y,分别计算测试样本y在训练集A每个类别中的局部近邻;线性重构权值向量计算模块用每个类别的局部近邻线性重构测试样本y,并得到每个类别的线性重构权值向量,同时线性重构权值向量需要满足范数约束条件;局部近邻稀疏表示残差计算模块根据每个类别的线性重构权值向量,计算测试样本y在每个类别的局部近邻稀疏表示残差;分类模块根据每个类别的局部近邻稀疏表示残差,对测试样本y进行分类。
-
公开(公告)号:CN101799872A
公开(公告)日:2010-08-11
申请号:CN201010144491.9
申请日:2010-04-12
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种场景图像的全局结构信息特征的提取方法,包括步骤如下:读取场景图像并判断是否为彩色图像,若为彩色图像则进行转换得到灰度图像,若为灰度图像则对灰度图像按照三个级别进行划分并得到三个级别划分对应的共31图像块;对图像块中每个像素的结构信息特征进行计算得到一个8维局部二元模式特征;对8维局部二元模式特征进行量化得到并计算1维局部二元模式量化特征的直方图,得到并对255维直方图特征进行主成份分析,得到40维直方图特征;计算8维局部二元模式特征的直方图,得到并将8维直方图特征和40维直方图特征融合,得到31个图像块的对应的48维结构信息特征进行融合,得到一幅图像的全局结构信息特征。
-
-
-
-
-
-
-
-
-