一种基于随机森林的个人信用风险评估方法

    公开(公告)号:CN110826618A

    公开(公告)日:2020-02-21

    申请号:CN201911057662.1

    申请日:2019-11-01

    Abstract: 本发明公开了一种基于随机森林的个人信用风险评估方法,属于提高数据分类的性能和准确率的分类技术,包括:获取用户的信贷历史数据作为原始数据集;将原数据集划分为训练数据集和测试数据集;生成若干树的随机森林模型;对随机森林模型中每棵决策树得到的分类结果计算其AUC值;制定基分类器提取标准并从随机森林模型中提取出相对高精度的决策树组成待聚类子森林;根据分类器相似性,聚类子森林,将决策树划分成多个类簇;从划分出的簇中选取较高准确率的树集组成高精度低相似的随机森林模型。本发明去除了分类性能差和相似的决策树,有效地提高了随机森林模型的分类精度,可用于银行信用评估等大规模数据挖掘场景中。

Patent Agency Ranking