-
公开(公告)号:CN112766383B
公开(公告)日:2024-06-28
申请号:CN202110088305.2
申请日:2021-01-22
Applicant: 浙江工商大学
Abstract: 本发明提出了一种基于特征聚类和标签相似性的新型标签增强方法。本发明采用的方法如下:给定多标签样本的集合M,将集合M分成两部分,一部分是表示特征的集合F,另一部分表示标签的集合L;先对集合M进行预处理,主要包括数据缺失值处理、数据归一化;通过一种基于特征聚类和标签相似性的方法找到样本a的邻近样本集合S;确定邻近样本集合S之后,通过标签权重的方法将样本a的标签从多标签数据状态,转化成标签分布的标签描述度;需要对所有的样本基于特征聚类和标签相似性的方法和标签权重的方法,得到标签分布的集合D。本发明简单高效,结合特征信息和标签信息,能有效地将多标签数据集转成标签分布数据集。
-
公开(公告)号:CN112766383A
公开(公告)日:2021-05-07
申请号:CN202110088305.2
申请日:2021-01-22
Applicant: 浙江工商大学
IPC: G06K9/62
Abstract: 本发明提出了一种基于特征聚类和标签相似性的新型标签增强方法。本发明采用的方法如下:给定多标签样本的集合M,将集合M分成两部分,一部分是表示特征的集合F,另一部分表示标签的集合L;先对集合M进行预处理,主要包括数据缺失值处理、数据归一化;通过一种基于特征聚类和标签相似性的方法找到样本a的邻近样本集合S;确定邻近样本集合S之后,通过标签权重的方法将样本a的标签从多标签数据状态,转化成标签分布的标签描述度;需要对所有的样本基于特征聚类和标签相似性的方法和标签权重的方法,得到标签分布的集合D。本发明简单高效,结合特征信息和标签信息,能有效地将多标签数据集转成标签分布数据集。
-
公开(公告)号:CN112463894A
公开(公告)日:2021-03-09
申请号:CN202011352442.4
申请日:2020-11-26
Applicant: 浙江工商大学
IPC: G06F16/28 , G06F16/2457
Abstract: 本发明公开了一种基于条件互信息和交互信息的多标签特征选择方法。本发明基于条件互信息重新定义特征相关项将已选特征的条件互信息纳入进来。又从特征交互的角度定义标签之间的冗余,将其纳入冗余项,定义了一个多标签特征选择算法,有效地选择特征子集,提高多标签分类模型的性能。其中,所述发明包括:对多标签数据集进行预处理,其中包括缺失值填充,数据离散化等;利用多标签特征选择算法MCIMII对处理过的数据集进行特征筛选,得到筛选后的特征集。将得到的特征数据集输入到MLKNN模型中,得到数据集优化后的MLKNN模型。
-
公开(公告)号:CN112463894B
公开(公告)日:2022-05-31
申请号:CN202011352442.4
申请日:2020-11-26
Applicant: 浙江工商大学
IPC: G06F16/28 , G06F16/2457
Abstract: 本发明公开了一种基于条件互信息和交互信息的多标签特征选择方法。本发明基于条件互信息重新定义特征相关项将已选特征的条件互信息纳入进来。又从特征交互的角度定义标签之间的冗余,将其纳入冗余项,定义了一个多标签特征选择算法,有效地选择特征子集,提高多标签分类模型的性能。其中,所述发明包括:对多标签数据集进行预处理,其中包括缺失值填充,数据离散化等;利用多标签特征选择算法MCIMII对处理过的数据集进行特征筛选,得到筛选后的特征集。将得到的特征数据集输入到MLKNN模型中,得到数据集优化后的MLKNN模型。
-
-
-