-
公开(公告)号:CN113469406A
公开(公告)日:2021-10-01
申请号:CN202110550194.2
申请日:2021-05-20
Applicant: 杭州电子科技大学
Abstract: 本发明提出了一种结合多粒度窗口扫描和组合多分类的用户流失预测方法,包括如下步骤:S1.获取电信用户数据,并进行标记;S2.对数据进行预处理;S3.训练组合模型:对预处理后的训练集中的少数类样本进行过采样,对多数类样本进行欠采样;根据采样后的少数类样本数量,将多数类样本分成i份,和少数类样本组成新的数据子集Ni,然后对Ni使用ENN算法进行降噪;对降噪后的少数类样本和多数类样本进行多粒度窗口扫描,得到增强的重构向量,对重构的向量使用不同的算法进行计算,得到组合模型;S4.用训练好的组合模型对数据集进行预测。该方法能够对多数类采用欠采样算法,使得多数类与少数类的类别更加平衡,采用多分类器的组合模型预测可以最大化各种模型的优点。