基于欠采样的信用卡欺诈检测方法及系统、介质、设备

    公开(公告)号:CN111461855B

    公开(公告)日:2023-07-28

    申请号:CN201910046954.9

    申请日:2019-01-18

    Applicant: 同济大学

    Abstract: 本发明提供一种基于欠采样的信用卡欺诈检测方法及系统、介质、设备,包括:使用高斯混合模型拟合数据集中训练集的多数类样本;使用拟合好的高斯混合模型预测训练集内少数类样本的概率密度值,并选择该概率密度值中最大值作为两类样本的交叉边缘;以该交叉边缘为中心,从交叉边缘向上和向下延伸设置采样上界和下界,以此进行欠采样获取欠采样数据集,将欠采样数据集与少数类样本集合并成均衡训练集;依据均衡训练集训练机器学习分类器;使用训练完成的机器学习分类器检测信用卡交易数据集。本发明运用高斯混合模型抓取两类样本分布交叉边缘的样本,对两类样本的识别提供了更多的有用信息,提高分类器在针对信用卡欺诈检测领域内的识别准确率。

    基于欠采样的信用卡欺诈检测方法及系统、介质、设备

    公开(公告)号:CN111461855A

    公开(公告)日:2020-07-28

    申请号:CN201910046954.9

    申请日:2019-01-18

    Applicant: 同济大学

    Abstract: 本发明提供一种基于欠采样的信用卡欺诈检测方法及系统、介质、设备,包括:使用高斯混合模型拟合数据集中训练集的多数类样本;使用拟合好的高斯混合模型预测训练集内少数类样本的概率密度值,并选择该概率密度值中最大值作为两类样本的交叉边缘;以该交叉边缘为中心,从交叉边缘向上和向下延伸设置采样上界和下界,以此进行欠采样获取欠采样数据集,将欠采样数据集与少数类样本集合并成均衡训练集;依据均衡训练集训练机器学习分类器;使用训练完成的机器学习分类器检测信用卡交易数据集。本发明运用高斯混合模型抓取两类样本分布交叉边缘的样本,对两类样本的识别提供了更多的有用信息,提高分类器在针对信用卡欺诈检测领域内的识别准确率。

Patent Agency Ranking