一种面向歧义标记样本的特征选择方法

    公开(公告)号:CN116955986A

    公开(公告)日:2023-10-27

    申请号:CN202310725057.7

    申请日:2023-06-19

    Applicant: 东南大学

    Inventor: 张敏灵 鲍伟轩

    Abstract: 本发明公开了一种面向含歧义标记样本的特征选择方法,该方法对具有噪声标记信息的样本进行特征筛选,以达到数据预处理的目的。改方法包括以下步骤:(1)基于含歧义标记的原始数据信息初始化标记置信度,以标记置信度方式刻画标记信息;(2)根据样本信息计算每个特征变量与标记变量之间的互信息值;(3)选择前个与标记变量具有最大互信息值的特征作为特征子集元素;(4)根据所选特征子集进行kNN聚合,更新样本示例的标记置信度;(5)若标记置信度不变,则转到步骤(6),否则转到步骤(2);(6)根据所选特征子集构造低维数据集;(7)结束。

Patent Agency Ranking