-
公开(公告)号:CN119939201A
公开(公告)日:2025-05-06
申请号:CN202411853509.0
申请日:2024-12-16
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F18/211 , G06F18/213 , G06F18/241 , G06F18/25 , G06N20/00
Abstract: 本申请公开一种多视图特征选择方法、模型训练方法、设备及程序产品,方法包括:获取第一多视图数据集;第一多视图数据集包括多个第一视图,任一第一视图中包括一个或多个第一特征子集,第一特征子集中包括原始数据集中原始数据对应的第一特征值;确定每个第一特征子集中第一特征值的分布差异;根据第一特征子集中第一特征值的分布差异,确定第一特征子集的权重;根据第一特征子集的权重,从多个第一特征子集中确定最优第一特征子集。本发明通过关注不同类别原始数据的第一特征值的分布差异层面,而不是去关注不同类别原始数据的数量差异层面,实现对所有类别的原始数据进行平等对待,以减轻类别不平衡问题的影响,从而特征选择的效果也更好。