-
公开(公告)号:CN104363981A
公开(公告)日:2015-02-18
申请号:CN201480000558.8
申请日:2014-07-14
Applicant: 中国科学院自动化研究所
IPC: A99Z99/00
CPC classification number: G06K9/80
Abstract: 本发明涉及一种人脸验证方法和系统,方法包括:利用主成分分析和线性判别分析对高维人脸特征数据分别进行预处理,其中包括设置主成分分析降维后的数据维度;建立判别式高阶玻尔兹曼机,设置隐含层的节点数;利用张量对角化的策略来减少该判别式高阶玻尔兹曼机的模型参数;把成对的人脸数据输入到判别式高阶玻尔兹曼机中,利用随机梯度下降算法来最大化关系类别的条件概率,从而迭代地优化该玻尔兹曼机的权重,从而得到最终的判别式高阶玻尔兹曼机;向判别式高阶玻尔兹曼机模型输入待验证的成对人脸数据,得到对应的验证结果数据。本发明通过在无监督玻尔兹曼机模型中引入数据关系类别信息,使模型判别力增强,更适于具有精度要求的人脸验证。
-
公开(公告)号:CN102693316B
公开(公告)日:2014-03-26
申请号:CN201210171539.4
申请日:2012-05-29
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于线性泛化回归模型的跨媒体检索方法。该方法首先提取不同模态对象的语义特征,再利用线性泛化回归模型建立各个模态特征之间的回归关系,实现不同模态特征的相互转换,接着利用多类Logistic回归算法估计转换后模态对象的后验概率分布,最后利用距离度量的方法来计算测试样本和数据库样本之间的距离,从而输出检索得到的最相似的前N个数据库中的样本。本发明在跨越不同模态的语义鸿沟时,可以最大限度地防止不同模态媒体在转换时有效信息的泄露,从而保证不同模态信息传递的有效性,进一步提高跨媒体搜索的鲁棒性和准确性,具有良好的运用前景和可观的市场价值。
-
公开(公告)号:CN103345656A
公开(公告)日:2013-10-09
申请号:CN201310316221.5
申请日:2013-07-17
Applicant: 中国科学院自动化研究所
IPC: G06N3/02
Abstract: 本发明公开了一种基于多任务深度神经网络的数据识别方法及其装置。该方法包括:步骤1、建立多任务深度神经网络;步骤2、将所述多任务深度神经网络相邻两层看作限制的波尔兹曼机,采用无监督地自底向上的逐层训练方法来预训练该多任务深度神经网络,获得相邻层之间的初始连接权重;步骤3、利用反向传播算法有监督地最小化关于所述网络权重的目标函数,以获得优化后的网络权重;步骤4、将待识别数据输入具有优化后网络权重的所述多任务深度神经网络,得到输出层节点值,并根据输出层节点值得出所述待识别数据所属的类别。本方法利用神经网络来挖掘不同标签之间的关联性,在标签数量较多的大规模图像标注中仍然可以保证较高的图像标注准确率。
-
公开(公告)号:CN102945373A
公开(公告)日:2013-02-27
申请号:CN201210408367.8
申请日:2012-10-24
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 一种基于上下文的局部空间信息建模方法,包括步骤:在提取每个图像的局部特征后,提取相应的上下文特征;根据每个局部特征对应的视觉单词,从测试图像中随机提取局部特征分组;利用聚类算法,在各组局部特征对应的上下文特征集合上训练得到多组上下文模式;根据局部特征对应的不同上下文模式进行聚集操作,将聚集结果串联得到图像的最终表达。本发明对于未经过对齐处理的图像,依然能够有效地处理其空间信息。在实际应用中,将该方法与现有的考虑绝对空间关系的方法相结合,还能够进一步提升图像分类精度。
-
公开(公告)号:CN102663447A
公开(公告)日:2012-09-12
申请号:CN201210133488.6
申请日:2012-04-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于判别相关分析的跨媒体检索方法,该方法包括以下步骤:建立跨媒体训练数据库,依次对其中不同模态样本进行特征提取、均值预处理和线性投影变换,并根据投影空间设定一目标函数;求解目标函数得到线性投影向量;建立跨媒体测试数据库;对待检索对象依次进行特征提取和均值预处理;使用所述线性投影向量对经均值预处理的特征数据进行线性投影变换;计算两模态数据投影变量之间的欧式距离,并进行升序排序,从而得到跨媒体检索结果。本发明方法能够对特征数据进行有效地降维,从而广泛地应用在其他很多多模态工作中,比如多模态生物特征识别。
-
公开(公告)号:CN120014488A
公开(公告)日:2025-05-16
申请号:CN202510043915.9
申请日:2025-01-10
Applicant: 中国科学院自动化研究所
IPC: G06V20/17 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明提供一种精细化对齐学习的导航模型训练方法、导航方法及装置,该精细化对齐学习的导航模型训练方法包括:对从无人机航拍图像中提取的视觉特征、语义特征和空间特征进行加权融合,得到语义网格特征;基于多项辅助预测任务根据语义网格特征对实体与地标对象的精细化对齐关系进行显示学习,得到视觉表征;以精细化空中视觉对话导航数据集为训练样本,以视觉表征为输入特征,以综合损失为损失函数对导航模型进行迭代训练,得到空中视觉对话导航模型;其中,综合损失基于导航损失函数和多项辅助预测任务对应的损失函数确定。本发明方法通过全面融合多模态特征,提高了无人机在复杂场景中的导航精度、对齐能力和任务执行效率。
-
公开(公告)号:CN118135660B
公开(公告)日:2025-05-16
申请号:CN202410326444.8
申请日:2024-03-21
Applicant: 山东大学 , 山东科技大学 , 中国科学院自动化研究所 , 银河水滴科技(江苏)有限公司 , 泰华智慧产业集团股份有限公司
IPC: G06V40/20 , G06V10/80 , G06V10/42 , G06V10/82 , G06N3/0464 , G06V10/764
Abstract: 本发明涉及一种视角缺失条件下的联合多视角信息瓶颈的跨视角步态识别方法,包括:(1)构建特征提取模型的网络架构,并进行训练;包括:跨视角全局提取模块构建;跨视角一致性提取模块构建;自适应选择性特征融合模块构建;整体框架训练;(2)跨视角步态识别;包括:将查询数据集的步态轮廓序列送入训练好的视角缺失条件下的联合多视角信息瓶颈的跨视角步态识别模型中提取步态特征,通过与注册数据集进行特征相似性比对,完成查询样本的身份识别。本发明使网络可以更有效地捕捉输入数据中的关键信息,从而提高整个网络在处理不同输入分布情境下的表达能力。
-
公开(公告)号:CN115050465B
公开(公告)日:2025-02-07
申请号:CN202210476331.7
申请日:2022-04-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种诊断数据分析方法及系统,该方法包括:获取目标诊断历史数据对应的医学知识子图谱,并对所述医学知识子图谱进行向量转换,得到疾病代码嵌入向量;基于关系注意力机制、节点注意力机制以及消息传递机制,根据所述疾病代码嵌入向量进行特征提取,并将提取得到的向量特征进行聚合处理,得到特征向量表示;对所述特征向量表示进行诊断预测,得到诊断预测数据。本发明将医学知识图谱与基于关系注意力机制、节点注意力机制以及消息传递机制构建的层次化注意力关系网络进行结合,根据诊断历史数据进行诊断预测,从而得到更为准确的诊断预测结果数据。
-
公开(公告)号:CN118982700A
公开(公告)日:2024-11-19
申请号:CN202410954687.6
申请日:2024-07-16
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本公开提供一种图分类模型的训练方法、预测方法、训练装置和预测装置,训练方法包括:获取包括信息结构图的训练图数据,其中,信息结构图包括分子结构图或情感文本图;分别利用第一子图提取器和第二子图提取器从训练图数据提取第一标签预测性子图和第二标签预测性子图;分别利用第一子图分类器和第二子图分类器预测与第一标签预测性子图和第二标签性子图对应的第一标签和第二标签;根据第一标签、第二标签、第一子图提取器和第二子图提取器分别通过学习得到的第一掩码矩阵和第二掩码矩阵计算综合损失,并且以综合损失最小为目标调整第一图分类器和第二图分类器的各个参数,以训练得到图分类模型,其中,第一掩码矩阵和第二掩码矩阵彼此不同。
-
公开(公告)号:CN118736355A
公开(公告)日:2024-10-01
申请号:CN202410747440.7
申请日:2024-06-11
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种视觉语言模型在定位任务中的性能评测方法及装置,其特征在于,定位任务包括基于属性区分的定位任务、基于关系区分的定位任务以及基于主次区分的定位任务,方法包括:构建用于视觉语言模型进行性能评测的评估数据集,针对评估数据集中的评估样本,通过视觉语言模型对评估样本执行定位任务,得到评估样本中的定位热图,根据定位热图确定评估样本的性能评测得分;确定性能评测得分的平均值为评估数据集的平均准确率作为视觉语言模型的性能评测结果。通过本申请,能够验证视觉语言模型在区分属性、区分关系以及区分主次三个维度的组合推理能力,用以解决现有技术中预训练的视觉语言模型在组合推理能力方面表现差的缺陷。
-
-
-
-
-
-
-
-
-