-
公开(公告)号:CN109739844A
公开(公告)日:2019-05-10
申请号:CN201811599413.0
申请日:2018-12-26
Applicant: 西安电子科技大学
IPC: G06F16/215 , G06F16/2458
Abstract: 本发明公开了一种基于衰减权重的数据分类方法,本发明主要解决现有传统的分类方法只能接受数值类型的数据集,忽略数据本身的时间特性,容易过拟合,分类准确率不高的问题。其实现步骤是:1、获取训练样本和预测样本;2、清洗数据;3、生成类型转化数据集;4、标准化处理;5、生成训练集和预测集;6、计算训练集中每个样本的衰减权重;7、利用特征选择方法训练极限梯度增强XGBoost的多分类器;8、对预测集中每个样本进行分类。本发明利用数据本身的时间特性信息赋予样本衰减权重,能够接受更多类型的数据,有效地提高了分类的准确率,可应用于复杂多变的业务场景下的数据分类。
-
公开(公告)号:CN109739844B
公开(公告)日:2023-03-24
申请号:CN201811599413.0
申请日:2018-12-26
Applicant: 西安电子科技大学
IPC: G06F16/215 , G06F16/2458
Abstract: 本发明公开了一种基于衰减权重的数据分类方法,本发明主要解决现有传统的分类方法只能接受数值类型的数据集,忽略数据本身的时间特性,容易过拟合,分类准确率不高的问题。其实现步骤是:1、获取训练样本和预测样本;2、清洗数据;3、生成类型转化数据集;4、标准化处理;5、生成训练集和预测集;6、计算训练集中每个样本的衰减权重;7、利用特征选择方法训练极限梯度增强XGBoost的多分类器;8、对预测集中每个样本进行分类。本发明利用数据本身的时间特性信息赋予样本衰减权重,能够接受更多类型的数据,有效地提高了分类的准确率,可应用于复杂多变的业务场景下的数据分类。
-