一种大规模数据流中电信欺诈风险识别方法

    公开(公告)号:CN109274836B

    公开(公告)日:2021-06-15

    申请号:CN201811287123.2

    申请日:2018-10-31

    Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。

    基于无监督学习的诈骗呼叫序列检测方法

    公开(公告)号:CN110059889B

    公开(公告)日:2021-05-28

    申请号:CN201910344174.2

    申请日:2019-04-26

    Abstract: 本发明提供了基于无监督学习的诈骗呼叫序列检测方法,包括:构造主叫呼叫序列和呼叫二部图;在呼叫二部图中进行随机游走过程,推断各主叫号码对应节点的低维嵌入表示向量;获取各被叫号码的唯一标识,以主叫号码对应节点的低维嵌入表示向量以及第M个被叫号码对应的唯一标识为神经网络的输入,以第M+1个被叫号码对应的唯一标识为输出,训练获得神经网络预测模型;获取待检测主叫呼叫序列中主叫号码对应节点的低维嵌入表示向量以及各被叫号码对应的唯一标识,并输入所述神经网络预测模型,若得到的预测唯一标识与实际唯一标识的误差大于设定阈值,则判断主叫号码为诈骗号码。本发明中提出的方法容易实现并行化计算,可以实现较高的检测效率。

    基于无监督学习的诈骗呼叫序列检测方法

    公开(公告)号:CN110059889A

    公开(公告)日:2019-07-26

    申请号:CN201910344174.2

    申请日:2019-04-26

    Abstract: 本发明提供了基于无监督学习的诈骗呼叫序列检测方法,包括:构造主叫呼叫序列和呼叫二部图;在呼叫二部图中进行随机游走过程,推断各主叫号码对应节点的低维嵌入表示向量;获取各被叫号码的唯一标识,以主叫号码对应节点的低维嵌入表示向量以及第M个被叫号码对应的唯一标识为神经网络的输入,以第M+1个被叫号码对应的唯一标识为输出,训练获得神经网络预测模型;获取待检测主叫呼叫序列中主叫号码对应节点的低维嵌入表示向量以及各被叫号码对应的唯一标识,并输入所述神经网络预测模型,若得到的预测唯一标识与实际唯一标识的误差大于设定阈值,则判断主叫号码为诈骗号码。本发明中提出的方法容易实现并行化计算,可以实现较高的检测效率。

    一种诈骗电话筛选分析方法及系统

    公开(公告)号:CN106686264A

    公开(公告)日:2017-05-17

    申请号:CN201610965273.9

    申请日:2016-11-04

    Abstract: 本发明属于电信中有害电话监控技术领域,尤其是涉及一种诈骗电话筛选分析方法及系统。本发明的系统利用诈骗电话分析模型对历史数据进行分析,确定模型各特征权重值;对实时数据进行分析检测,检测结果与设定阈值比较给出诈骗电话的置信度。整个系统由数据查询管理系统、实时检测系统、模型自学习系统、趋势预测系统、数据存储系统组成。数据查询管理系统提供全量话单查询、诈骗话单查询、模型参数管理、自学习管理、趋势预测分析功能。实时检测系统通过诈骗电话发现模型实时分析、检测话单数据,发现诈骗电话。模型自学习系统对历史话单数据分析,通过自学习算法不断优化模型参数。趋势预测系统提供对未来诈骗电话趋势和变化进行预测。数据存储系统采用分布式存储系统,大数据分析处理引擎为整个系统提供快速数据抓取、数据分发、数据查询功能。

    一种基于改进的主动学习技术的电信欺诈分类检测方法

    公开(公告)号:CN109492026B

    公开(公告)日:2021-11-09

    申请号:CN201811301410.4

    申请日:2018-11-02

    Abstract: 本发明公开了一种基于改进的主动学习技术的电信欺诈分类检测方法,涉及一种基于改进的主动学习技术的电信欺诈分类检测方法。抽取数量为X的数据划分训练集和测试集。从训练集中抽取样本作为初始训练集,其余为未标记样本。若当前训练集中正类与负类样本数量的比值不小于阈值e,训练有监督分类器f并构造强组合分类器F;将未标记样本逐个放入有监督分类器f中进行类别评分,得到类别评分结果,输入主动学习采样算法,得到信息量大小的评分。选取信息量最大的前D个进行标注,并加入训练集中;当前训练集样本数量大于等于X1,或者迭代次数大于等于C时结束,输出训练好的分类器f。本发明具有较强的稳定性和鲁棒性,实现较高的分类和检测效率。

    一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法

    公开(公告)号:CN109587350B

    公开(公告)日:2021-06-22

    申请号:CN201811373658.1

    申请日:2018-11-16

    Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K‑Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K‑Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。

    一种多级指标体系
    20.
    发明公开

    公开(公告)号:CN112990763A

    公开(公告)日:2021-06-18

    申请号:CN202110406076.4

    申请日:2021-04-15

    Abstract: 本发明特别涉及一种多级指标体系。该多级指标体系,包括指标层级判断模块,内侧计算模块,迭代次数执行判断模块,外侧计算模块和指数存储模块;内侧计算模块按照指标体系从内到外依次计算上一层级的指标要素得分;外侧计算模块综合所有层级的指标要素得分,计算指标体系的综合指数K。该多级指标体系,综合考虑指标体系中各层级指标要素的得分情况,以最后一级细分指标要素得分为主,其他层级指标要素得分为辅的计算方式,克服了多数情况下指标体系指数计算仅通过最后一级指标体系来进行确定的弊端;同时,在各级指标要素计算中,采用取对数或开根号的计算方式来对指标要素评分进行降噪处理,保障和提升了指数计算的合理性。

Patent Agency Ranking