-
公开(公告)号:CN116523531A
公开(公告)日:2023-08-01
申请号:CN202310470798.5
申请日:2023-04-24
Applicant: 湖北工业大学
IPC: G06Q30/018 , G06N3/006 , G06N20/00 , G06F16/182 , G06N5/01
Abstract: 本发明涉及机器学习、数据挖掘、分布式计算技术,具体涉及一种基于分布式深度旋转森林的信用欺诈检测方法及系统,该方法将F个旋转森林将通过Spark的Map算子进行并行处理。另外在旋转森林的内部,让部分决策树组成子森林,每个子森林进行并行构建,子森林之间将共享单个旋转矩阵。构建每个子森林的旋转矩阵,经过多次抽样并经过PCA处理,借助Spark Mllib中的PCA算法同样进行并行构建。原始欺诈交易数据从HDFS读取后初始化为RDD,数据经过级联层完成并行训练后,对交易行为进行分类预测。该方法在保证分类准确率的同时,提高了数据的处理速度和效率,解决了单机算法面临的计算存储能力有限和扩展性差的问题。