-
公开(公告)号:CN116910660A
公开(公告)日:2023-10-20
申请号:CN202311145834.7
申请日:2023-09-07
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F18/2415 , G06F18/214 , G06F18/23 , G06N3/0895
Abstract: 本发明提供了一种面向不平衡数据的自步半监督集成分类器训练方法及系统,其属于数据处理技术领域,该方案通过结合分类器和加权k近邻确定安全的伪标注样本,来提高伪标注样本的质量;然后,使用基于聚类的自步学习选择伪标注样本,有效提高添加的伪标注样本的多样性并缓解错误积累;最后,利用增强后的平衡样本集训练基分类器并集成,来缓解由不平衡的类分布造成的分类器偏差,特别是对于医疗领域的图像分类、征信风险评估领域的风险评估等经常存在数据样本不平衡的情况下,能够有效保证训练后分类器分类结果的准确性。
-
公开(公告)号:CN119560155A
公开(公告)日:2025-03-04
申请号:CN202411633731.X
申请日:2024-11-15
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
IPC: G16H50/30 , G16H50/70 , G16H10/60 , G06N3/0455 , G06N3/082
Abstract: 本发明公开了基于电子健康记录的临床预测方法、系统、设备及介质,属于自然语言处理技术领域,本发明要解决的技术问题为如何个性化填补EHR数据,提高临床上对患者健康状况预测精度,采用的技术方案为:获取EHR数据:构建就诊序列矩阵和对应的缺失掩码矩阵,获取患者EHR数据;初步插补与个性化调整;随机生成掩码矩阵;特征编码;PIPER特征融合:通过PIPER层的时间注意力机制和变量注意力机制对初始特征表示的时间维度和特征维度进行特征融合,生成患者健康表示;预训练:对患者健康表示进行重构,并通过MIT损失函数计算重构值与真实观测值之间的误差,从而PIPER层优化插补能力;微调:通过任务特定的解码器进行健康状态的预测任务。
-
公开(公告)号:CN119474417A
公开(公告)日:2025-02-18
申请号:CN202411506301.1
申请日:2024-10-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F16/48 , G06N3/0455 , G06N3/096 , G06F18/213 , G06F18/25 , G06N3/09 , G06N3/084 , G06N3/0985
Abstract: 本发明公开了基于原型的联邦医学多模态哈希检索方法、系统、设备及介质,属于联邦学习及多模态哈希检索技术领域,本发明要解决的技术问题为如何在多模态哈希检索过程中有效地保障医学数据的隐私性和安全性,避免因数据的不平衡造成的失衡缺陷,采用的技术方案为:构建医学多模态数据集;构建基于原型的联邦医学多模态哈希检索模型:利用神经网络和深度学习技术构建基于原型的联邦医学多模态哈希检索模型;训练模型:利用最终的数据集对基于原型的联邦医学多模态哈希检索模型进行训练;构建基于原型的联邦医学多模态哈希检索模型具体如下:医学多模态融合;原型参数增强学习;哈希检索查询。
-
公开(公告)号:CN116910660B
公开(公告)日:2024-01-23
申请号:CN202311145834.7
申请日:2023-09-07
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F18/2415 , G06F18/214 , G06F18/23 , G06N3/0895
Abstract: 本发明提供了一种面向不平衡数据的自步半监督集成分类器训练方法及系统,其属于数据处理技术领域,该方案通过结合分类器和加权k近邻确定安全的伪标注样本,来提高伪标注样本的质量;然后,使用基于聚类的自步学习选择伪标注样本,有效提高添加的伪标注样本的多样性并缓解错误积累;最后,利用增强后的平衡样本集训练基分类器并集成,来缓解由不平衡的类分布造成的分类器偏差,特别是对于医疗领域的图像分类、征信风险评估领域的风险评估等经常存在数据样本不平衡的情况下,能够有效保证训练后分类器分类结果的准确性。(56)对比文件Hongjiao Guan 等.A GeneralizedOptimization Embedded Framework ofUnfersampling Ensembles for ImbalancedClassification《.researchGate》.2021,第1-10页.Yangguang Shao.Dual Self-Paced SMOTEfor Imbalanced Data《.2022 26thInternational Conference on PattenRecognition》.2022,第3083-3089页.
-
公开(公告)号:CN118035470A
公开(公告)日:2024-05-14
申请号:CN202410349165.3
申请日:2024-03-26
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F16/43 , G06F16/483 , G06F18/25 , G06F40/30 , G06F40/289 , G06V20/70 , G06V10/40 , G06V10/82 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了基于深度语义代理的多模态哈希检索方法、系统、设备及介质,属于人工智能及多模态哈希检索技术领域,本发明要解决的技术问题为多模态哈希检索过程中多模态融合不充分的问题以及忽略的数据本身与监督语义之间的关联弱,技术方案为:构建多模态数据集:获取图像模态和文本模态数据集,并进行预处理,再使用CLIP预训练模型对图像模态和文本模态数据集进行深度特征提取,并按照比例构建训练集、测试集和检索集,再组合生成最终的数据集;构建基于深度语义代理的多模态哈希检索模型:利用神经网络和深度学习方法构建基于深度语义代理的多模态哈希检索模型;训练模型:利用最终的数据集对基于深度语义代理的多模态哈希检索模型进行训练。
-
公开(公告)号:CN118013056A
公开(公告)日:2024-05-10
申请号:CN202410311467.1
申请日:2024-03-19
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F16/43 , G06F16/483 , G06N3/0455 , G06N3/098 , G06F21/60 , G06F21/62
Abstract: 本发明公开了基于原型隐私加密的联邦跨模态哈希检索方法、系统、介质及设备,属于联邦学习及跨模态检索技术领域,本发明要解决的技术问题为如何在联邦跨模态哈希检索过程中有效地保障数据的隐私性和安全性,避免隐私泄露,技术方案为:构建数据集;深度特征提取;构建联邦跨模态哈希检索模型:利用神经网络和深度学习方法构建基于原型隐私加密的联邦跨模态哈希检索模型;训练模型:在最终数据集中对基于原型隐私加密的联邦跨模态哈希检索模型进行训练;其中,构建联邦跨模态哈希检索模型具体如下:原型隐私安全对称加密;个性化知识保存;哈希检索查询:通过客户端生成的哈希码进行检索查询,获取平均精度均值作为检索性能的评估指标。
-
-
-
-
-