-
公开(公告)号:CN112884038A
公开(公告)日:2021-06-01
申请号:CN202110181037.9
申请日:2021-02-06
Applicant: 河南大学
IPC: G06K9/62
Abstract: 本发明提供了基于多距离度量学习的多标签特征选择方法,具体包括如下步骤:步骤1:归一化训练数据集;步骤2:初始化特征加权矩阵并设置超参数;步骤3:基于近邻模型计算近似留一法分类误差;步骤4:计算特征图正则化项、标签图正则化项和范数正则化项;步骤5:基于梯度下降技术最小化总目标损失函数,直到满足停止准则;步骤6:根据最终输出的特征加权矩阵行向量的长度对特征进行降序排序,前K个特征即为算法选出的最优特征子集。本发明通过特征图正则化项和标签图正则化项可以保持特征的相关性和标签的相关性,通过范数正则化项可以保证特征加权矩阵的行稀疏性,因此能够很好地进行多标签分类任务的特征选择。
-
公开(公告)号:CN113177608B
公开(公告)日:2023-09-05
申请号:CN202110559948.0
申请日:2021-05-21
Applicant: 河南大学
IPC: G06F18/2321 , G06F18/214
Abstract: 本发明公开一种针对不完整数据的近邻模型特征选择方法及装置,该方法包括:步骤1、初始化特征加权向量w=[w1,w2,...,wm]∈Rm为全1的向量;步骤2、基于给定的特征加权向量w构建不完整数据的填充损失函数;步骤3、采用交替迭代优化算法最小化步骤2中的损失函数;步骤4、基于填充后的数据构建近邻模型特征选择方法的损失函数;步骤5、采用梯度下降法优化步骤4中的损失函数;步骤6、循环执行步骤3至步骤5,直到特征加权向量的长度变化小于阈值或达到最大迭代次数;步骤7、根据最终输出的特征加权向量对特征进行降序排序,从而选择出最优的特征子集。本发明在计算填充损失时考虑了特征的重要性,能够有效地提高针对不完整数据的特征选择的分类精度。
-
公开(公告)号:CN113177608A
公开(公告)日:2021-07-27
申请号:CN202110559948.0
申请日:2021-05-21
Applicant: 河南大学
IPC: G06K9/62
Abstract: 本发明公开一种针对不完整数据的近邻模型特征选择方法及装置,该方法包括:步骤1、初始化特征加权向量w=[w1,w2,...,wm]∈Rm为全1的向量;步骤2、基于给定的特征加权向量w构建不完整数据的填充损失函数;步骤3、采用交替迭代优化算法最小化步骤2中的损失函数;步骤4、基于填充后的数据构建近邻模型特征选择方法的损失函数;步骤5、采用梯度下降法优化步骤4中的损失函数;步骤6、循环执行步骤3至步骤5,直到特征加权向量的长度变化小于阈值或达到最大迭代次数;步骤7、根据最终输出的特征加权向量对特征进行降序排序,从而选择出最优的特征子集。本发明在计算填充损失时考虑了特征的重要性,能够有效地提高针对不完整数据的特征选择的分类精度。
-
-