-
公开(公告)号:CN101894264B
公开(公告)日:2012-11-14
申请号:CN201010195097.8
申请日:2010-05-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明为一种基于短语包模型的图像类别标注方法,该方法在现有的字包模型表示的基础上,引入视觉字之间的位置信息,提出了短语包模型表示策略。本发明有效的解决了传统字包模型缺乏位置信息导致判别性不足与加入分块的位置信息后对目标位移敏感之间的矛盾;使得图像在引入视觉字之间的位置信息而增加了判别性的同时,消除了对目标在图像中位移的敏感性,有效地提高了图像类别标注系统的性能,具有重要的应用价值。
-
公开(公告)号:CN119339282A
公开(公告)日:2025-01-21
申请号:CN202411213211.3
申请日:2024-08-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于脉冲Transformer网络的视觉信息识别方法,方法包括:获取待识别视觉信息的脉冲序列;基于脉冲Transformer网络,构建视觉信息识别模型;其中,采用傅里叶基函数或小波基函数中的一种或多种基函数,构建先验知识嵌入层;采用先验知识嵌入层替换所述脉冲Transformer网络中的注意力模块;将所述脉冲序列输入所述视觉信息识别模型中,得到所述待识别视觉信息的识别结果。本发明通过采用上述方法,解决相关技术中由于脉冲神经网络对于实数值的离散脉冲编码方式,导致使用脉冲Transformer网络的进行视觉信息识别时的准确率较低的问题。
-
公开(公告)号:CN102156885A
公开(公告)日:2011-08-17
申请号:CN201010112508.2
申请日:2010-02-12
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明为一种基于级联式码本生成的图像分类方法,该方法采用级联式的码本生成方式,根据训练样本的变化,动态地调整样本映射空间,使得训练样本更容易被分开,进而训练基于当前码本的分类器。测试图像依次通过训练好的每一个分类器,如果所有分类器输出为正,图像类别标签判别为正,否则,图像类别标签判别为负。该方法采用级联式的码本生成方法,使得每一轮的码本在保持较强的判别性的同时,降低了图像表示的维数,解决了码本多样性与维数灾难之间的矛盾;同时,本方法采用级联式的码本生成方式,使得每一轮训练正负样本数目相同,巧妙的解决了特定类别分类中常见的样本不均衡问题,具有重要的应用价值。
-
公开(公告)号:CN103218609B
公开(公告)日:2016-01-20
申请号:CN201310148805.6
申请日:2013-04-25
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
Abstract: 本发明公开了一种基于隐最小二乘回归的自适应多姿态人脸识别方法。该方法包含一种基于隐最小二乘回归的多姿态人脸识别方法,其包括:检测输入的人脸图像的区域大小及位置;对检测到的人脸图像进行校正,得到校正后的人脸图像;从校正后的人脸图像中提取人脸面部的特征值;根据所提取的人脸面部的特征值估计校正后的人脸图像的姿态类别;根据所述姿态类别选择与其对应的变换矩阵以及偏移向量,并根据所述变换矩阵、偏移向量和提取的特征值计算得到该人脸图像的身份特征向量;从已知人脸图像检索库中搜索与所输入的人脸图像的身份特征向量相似度最高的已知人脸图像,并返回该已知人脸图像的身份信息作为识别结果。
-
公开(公告)号:CN102156885B
公开(公告)日:2014-03-26
申请号:CN201010112508.2
申请日:2010-02-12
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明为一种基于级联式码本生成的图像分类方法,该方法采用级联式的码本生成方式,根据训练样本的变化,动态地调整样本映射空间,使得训练样本更容易被分开,进而训练基于当前码本的分类器。测试图像依次通过训练好的每一个分类器,如果所有分类器输出为正,图像类别标签判别为正,否则,图像类别标签判别为负。该方法采用级联式的码本生成方法,使得每一轮的码本在保持较强的判别性的同时,降低了图像表示的维数,解决了码本多样性与维数灾难之间的矛盾;同时,本方法采用级联式的码本生成方式,使得每一轮训练正负样本数目相同,巧妙的解决了特定类别分类中常见的样本不均衡问题,具有重要的应用价值。
-
公开(公告)号:CN103218609A
公开(公告)日:2013-07-24
申请号:CN201310148805.6
申请日:2013-04-25
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
Abstract: 本发明公开了一种基于隐最小二乘回归的自适应多姿态人脸识别方法。该方法包含一种基于隐最小二乘回归的多姿态人脸识别方法,其包括:检测输入的人脸图像的区域大小及位置;对检测到的人脸图像进行校正,得到校正后的人脸图像;从校正后的人脸图像中提取人脸面部的特征值;根据所提取的人脸面部的特征值估计校正后的人脸图像的姿态类别;根据所述姿态类别选择与其对应的变换矩阵以及偏移向量,并根据所述变换矩阵、偏移向量和提取的特征值计算得到该人脸图像的身份特征向量;从已知人脸图像检索库中搜索与所输入的人脸图像的身份特征向量相似度最高的已知人脸图像,并返回该已知人脸图像的身份信息作为识别结果。
-
公开(公告)号:CN102024049A
公开(公告)日:2011-04-20
申请号:CN201010591494.7
申请日:2010-12-08
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明是一种用于电子商务平台的图像检索方法,步骤S1:从商品图像库中提取所有商品图像的外观特征并用统计直方图向量描述,使提取的商品外观特征对图像的尺度、旋转、平移变换具有鲁棒性;然后通过查找最近邻方法把同一类商品图像库中所有商品外观特征与待检索商品图像的外观特征分别计算欧式距离,得到依据不同商品外观特征的商品图像的排序;步骤S2:依据所述排序,根据相似度打分;步骤S3:消费者根据对商品图像外观方面关注度的不同,对同一类商品图像的不同特征得分进行自主组合,将每种特征的得分乘上各自的关注度权重值,得分相加,根据总分得到与消费者所要检索的商品最相似的商品图像的排列。
-
公开(公告)号:CN101894264A
公开(公告)日:2010-11-24
申请号:CN201010195097.8
申请日:2010-05-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明为一种基于短语包模型的图像类别标注方法,该方法在现有的字包模型表示的基础上,引入视觉字之间的位置信息,提出了短语包模型表示策略。本发明有效的解决了传统字包模型缺乏位置信息导致判别性不足与加入分块的位置信息后对目标位移敏感之间的矛盾;使得图像在引入视觉字之间的位置信息而增加了判别性的同时,消除了对目标在图像中位移的敏感性,有效地提高了图像类别标注系统的性能,具有重要的应用价值。
-
-
-
-
-
-
-