-
公开(公告)号:CN119474418A
公开(公告)日:2025-02-18
申请号:CN202411506302.6
申请日:2024-10-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F16/48 , G06N3/0499 , G06N3/084 , G06N3/0985 , G06F18/213 , G06F18/22
Abstract: 本发明公开了基于多视角中心结构的多模态哈希检索方法、系统、设备及介质,属于人工智能及多模态哈希检索技术领域,本发明要解决的技术问题为多模态哈希检索过程中类内紧凑性和类间可分性之间取得平衡,采用的技术方案为:构建多模态数据集;构建基于多视角中心结构的多模态哈希检索模型;训练模型;其中,构建基于多视角中心结构的多模态哈希检索模型具体如下:模态特定原型学习:利用图像模态深度多层感知器和文本模态深度多层感知器分别从对应模态中提取细化特征,并计算图像模态和文本模态细化特征的平均值获取模态特定原型,进而获取图像模态的独特特征和文本模态的独特特征;多模态集成类原型学习;多视角语义增强哈希学习。
-
公开(公告)号:CN116910660B
公开(公告)日:2024-01-23
申请号:CN202311145834.7
申请日:2023-09-07
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F18/2415 , G06F18/214 , G06F18/23 , G06N3/0895
Abstract: 本发明提供了一种面向不平衡数据的自步半监督集成分类器训练方法及系统,其属于数据处理技术领域,该方案通过结合分类器和加权k近邻确定安全的伪标注样本,来提高伪标注样本的质量;然后,使用基于聚类的自步学习选择伪标注样本,有效提高添加的伪标注样本的多样性并缓解错误积累;最后,利用增强后的平衡样本集训练基分类器并集成,来缓解由不平衡的类分布造成的分类器偏差,特别是对于医疗领域的图像分类、征信风险评估领域的风险评估等经常存在数据样本不平衡的情况下,能够有效保证训练后分类器分类结果的准确性。(56)对比文件Hongjiao Guan 等.A GeneralizedOptimization Embedded Framework ofUnfersampling Ensembles for ImbalancedClassification《.researchGate》.2021,第1-10页.Yangguang Shao.Dual Self-Paced SMOTEfor Imbalanced Data《.2022 26thInternational Conference on PattenRecognition》.2022,第3083-3089页.
-
公开(公告)号:CN118035470A
公开(公告)日:2024-05-14
申请号:CN202410349165.3
申请日:2024-03-26
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F16/43 , G06F16/483 , G06F18/25 , G06F40/30 , G06F40/289 , G06V20/70 , G06V10/40 , G06V10/82 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了基于深度语义代理的多模态哈希检索方法、系统、设备及介质,属于人工智能及多模态哈希检索技术领域,本发明要解决的技术问题为多模态哈希检索过程中多模态融合不充分的问题以及忽略的数据本身与监督语义之间的关联弱,技术方案为:构建多模态数据集:获取图像模态和文本模态数据集,并进行预处理,再使用CLIP预训练模型对图像模态和文本模态数据集进行深度特征提取,并按照比例构建训练集、测试集和检索集,再组合生成最终的数据集;构建基于深度语义代理的多模态哈希检索模型:利用神经网络和深度学习方法构建基于深度语义代理的多模态哈希检索模型;训练模型:利用最终的数据集对基于深度语义代理的多模态哈希检索模型进行训练。
-
公开(公告)号:CN116910660A
公开(公告)日:2023-10-20
申请号:CN202311145834.7
申请日:2023-09-07
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F18/2415 , G06F18/214 , G06F18/23 , G06N3/0895
Abstract: 本发明提供了一种面向不平衡数据的自步半监督集成分类器训练方法及系统,其属于数据处理技术领域,该方案通过结合分类器和加权k近邻确定安全的伪标注样本,来提高伪标注样本的质量;然后,使用基于聚类的自步学习选择伪标注样本,有效提高添加的伪标注样本的多样性并缓解错误积累;最后,利用增强后的平衡样本集训练基分类器并集成,来缓解由不平衡的类分布造成的分类器偏差,特别是对于医疗领域的图像分类、征信风险评估领域的风险评估等经常存在数据样本不平衡的情况下,能够有效保证训练后分类器分类结果的准确性。
-
-
-