一种基于图嵌入的诈骗号码识别方法

    公开(公告)号:CN110177179A

    公开(公告)日:2019-08-27

    申请号:CN201910410802.2

    申请日:2019-05-16

    Abstract: 一种基于图嵌入的诈骗号码识别方法,包括:基于用户在一段时间内的通话信令,计算用户的通话特征指标,并构成每个用户的通话特征指标向量,同时,提取和用户在一段时间内存在通话关系的联系人作为用户的直接邻居,构成每个用户的直接邻居组;构建、并训练识别诈骗号码的图嵌入神经网络,其输入是目标用户和多个关联用户的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;将待识别的目标用户和多个关联用户的通话特征指标向量输入训练后的图嵌入神经网络,然后根据输出判断待识别的目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能基于诈骗电话“多点—点”的通联关系结构模式来实现诈骗号码的精准识别。

    一种基于图嵌入的诈骗号码识别方法

    公开(公告)号:CN110177179B

    公开(公告)日:2020-12-29

    申请号:CN201910410802.2

    申请日:2019-05-16

    Abstract: 一种基于图嵌入的诈骗号码识别方法,包括:基于用户在一段时间内的通话信令,计算用户的通话特征指标,并构成每个用户的通话特征指标向量,同时,提取和用户在一段时间内存在通话关系的联系人作为用户的直接邻居,构成每个用户的直接邻居组;构建、并训练识别诈骗号码的图嵌入神经网络,其输入是目标用户和多个关联用户的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;将待识别的目标用户和多个关联用户的通话特征指标向量输入训练后的图嵌入神经网络,然后根据输出判断待识别的目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能基于诈骗电话“多点—点”的通联关系结构模式来实现诈骗号码的精准识别。

    一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法

    公开(公告)号:CN109587350A

    公开(公告)日:2019-04-05

    申请号:CN201811373658.1

    申请日:2018-11-16

    Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K-Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K-Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。

    一种大规模数据流中电信欺诈风险识别方法

    公开(公告)号:CN109274836A

    公开(公告)日:2019-01-25

    申请号:CN201811287123.2

    申请日:2018-10-31

    Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。

    一种大规模数据流中电信欺诈风险识别方法

    公开(公告)号:CN109274836B

    公开(公告)日:2021-06-15

    申请号:CN201811287123.2

    申请日:2018-10-31

    Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。

Patent Agency Ranking