-
公开(公告)号:CN104834748A
公开(公告)日:2015-08-12
申请号:CN201510272498.1
申请日:2015-05-25
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/30244 , G06K9/6229
Abstract: 本发明公开了一种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。
-
公开(公告)号:CN102609732B
公开(公告)日:2013-09-25
申请号:CN201210021813.X
申请日:2012-01-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明公开了一种基于泛化视觉词典图编码的目标识别方法,包括以下步骤:对已经标好类别的目标图像进行特征提取,对提取的特征在视觉词典图上进行泛化编码,对编码结果进行训练并建模;对未知类别的图像进行特征提取,将提取的特征在视觉词典图上进行泛化编码,将编码结果输入到训练得到的模型,获得图像中目标的类别。该方法采用基于泛化视觉词典图的编码技术来提高分类精度,可用于智能视觉监控系统,使得监控系统能真正理解场景;可用于多媒体数字内容分析中的目标分析,判断目标的类别;可用于分析顾客对特定产品或者特定娱乐项目喜好。
-
公开(公告)号:CN103258217A
公开(公告)日:2013-08-21
申请号:CN201310180039.1
申请日:2013-05-15
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明公开一种基于增量学习的行人检测方法,可以用于大数据背景下的行人检测等领域。此方法包括:步骤1、利用训练集中的图像样本训练分类器,得到初始的分类器;步骤2、利用新的训练集进行分类器的增量学习,得到更新后的分类器;步骤3、利用更新后的分类器对待测图像进行检测,得到行人检测结果。该方法能够在极短时间内,占用少量内存,利用大数据背景中陆续收集到的多个大型训练集有效地学习并更新分类器。相对于常规方法,该方法速度快、占用内存小、使用方便,并可以学习到与常规方法非常接近的分类效果。
-
公开(公告)号:CN101840518A
公开(公告)日:2010-09-22
申请号:CN201010140974.1
申请日:2010-04-02
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 一种基于生物视觉机理的物体训练方法,包括步骤:对训练图像进行Gabor滤波操作,生成各种尺度下的S1图像;对S1图像进行梯度滤波的稀疏化操作,生成图像的稀疏表达;对S1的稀疏表达进行降采样操作生成C1;对C1图像进行滤波操作,滤波卷积子随机采样于所有训练样本的C1图像,生成S2图像;对S2图像进行求最大值操作,生成C2;用C2作为特征向量送入支持向量机SVM分类器。本发明用于智能视觉监控系统,帮助监控系统识别场景中目标的类别,使得监控系统能真正理解场景中正在发生什么,而且可以根据不同的目标类别采取不同的安全级别。用于多媒体数字内容分析中的目标分析,判断目标的类别,用于分析顾客对特定产品或者特定娱乐项目喜好。
-
公开(公告)号:CN118135659B
公开(公告)日:2024-09-20
申请号:CN202410326441.4
申请日:2024-03-21
Applicant: 山东大学 , 中国科学院自动化研究所 , 山东科技大学 , 银河水滴科技(江苏)有限公司 , 泰华智慧产业集团股份有限公司
Abstract: 本发明涉及一种基于多尺度骨架时空特征提取的跨视角步态识别方法,属于深度学习和模式识别技术领域,包括骨架数据预处理、全局空间特征提取网络构建、局部空间特征提取网络构建、多尺度时间特征提取网络构建、整体框架训练及跨视角步态识别。构建全局空间特征提取网络提取全局空间特征,构建基于超图表示的局部空间特征提取网络,充分建模关节‑部位、部位‑部位级局部空间关系。为了高效地提取多尺度时间特征,构建了多尺度时间特征提取网络。为了提高整个框架结构的判别能力,联合三元组损失和交叉熵损失对整个模型进行训练。最终利用训练好的模型进行跨视角步态识别。
-
公开(公告)号:CN116704612A
公开(公告)日:2023-09-05
申请号:CN202310711768.9
申请日:2023-06-15
Applicant: 山东大学深圳研究院 , 山东大学 , 中国科学院自动化研究所 , 山东建筑大学 , 山东科技大学 , 银河水滴科技(北京)有限公司 , 泰华智慧产业集团股份有限公司
Abstract: 本发明涉及一种基于对抗域自适应学习的跨视角步态识别方法,包括:(1)构建整个基于对抗域自适应学习的网络并进行训练:步态轮廓预处理;步态视角级子域划分;构建嵌有层次特征聚合策略的特征提取器;构建视角变化对抗消除模块;构建度量学习模块;整个基于对抗域自适应学习的网络对抗训练;(2)跨视角步态识别:将待识别身份的步态轮廓序列送入训练好的嵌有层次特征聚合策略的特征提取器获取步态特征,与注册数据集进行特征相似性比对,完成待测样本的身份识别。本发明能够充分挖掘步态序列中时空信息的同时有效消除视角变化的干扰;本发明实现了对步态轮廓序列更为充分、综合的时空特征提取;有效增强了网络判别性步态特征提取的能力。
-
公开(公告)号:CN106778705B
公开(公告)日:2020-03-17
申请号:CN201710065013.0
申请日:2017-02-04
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种行人个体分割方法和装置,所述方法包括:利用预先训练好的粗粒度人形轮廓分割模型对待处理图像进行行人分割,得到区块化分割结果;所述区块化分割结果中包括多个标示成背景和前景的区块,在所述对待处理图像中被标示成背景的区块不包含行人主体,而被标示成前景的区块包含行人主体的部分图像;去除所述待处理图像中所述区块化行人分割结果对应部分中的背景图像,得到粗粒度分割图像;将所述粗粒度分割图像输入至预先训练好的细粒度人形轮廓分割模型;所述预先训练好的细粒度人形轮廓分割模型输出个体行人分割结果;其中,所述粗粒度人形轮廓分割模型和细粒度人形轮廓分割模型均通过全卷积神经网络训练得到。
-
公开(公告)号:CN103559510B
公开(公告)日:2017-01-18
申请号:CN201310562450.5
申请日:2013-11-12
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明公开了一种利用相关主题模型识别社会群体行为的方法,该方法包括以下步骤:利用相关主题模型对视频数据集中的视频进行建模;基于相关主题模型和视频训练集得到优化目标函数;在使得优化目标函数最大的情况下计算相关主题模型中的各个参数,训练得到包括分类器的相关主题模型;将视频测试集中测试视频的词袋表示输入到相关主题模型中,利用隐含单元对可见单元的条件概率推断得到测试视频的主题表示;将测试视频的主题表示送入分类器中,得到对于相应测试视频最后的识别结果。本发明能够提取出更具区分力的稀疏相关主题表示来弥补低层视频特征和类别标签之间的语义鸿沟,同时在缺乏标签数据的情况下仍然能够达到很好的识别性能。
-
公开(公告)号:CN103279581B
公开(公告)日:2016-08-17
申请号:CN201310255896.3
申请日:2013-06-25
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下步骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。
-
公开(公告)号:CN103530689B
公开(公告)日:2016-01-20
申请号:CN201310530626.9
申请日:2013-10-31
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于深度学习的聚类方法,该方法包括以下步骤:得到深度神经网络的初始网络权重;对样本进行随机分组并映射到特征空间;将原始深度神经网络的目标函数加入特征层的类内约束函数;更新深度神经网络的网络权重,计算得到新的特征层;将每个样本分配至最近聚类中心所在的类组,计算新的聚类中心;以新的聚类中心代替类内约束函数的聚类中心,返回网络权重更新步骤进行迭代,得到并输出最终聚类分组结果。本发明将样本从不易聚类的原始数据空间,通过深度神经网络的非线性映射,得到高度可分的特征用于聚类,并且可以不断优化网络结构得到更好的聚类效果,本发明以较小的内存消耗以及较高的聚类精度优于常规聚类算法。
-
-
-
-
-
-
-
-
-