-
公开(公告)号:CN110047509A
公开(公告)日:2019-07-23
申请号:CN201910240865.8
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种两级子空间划分方法及装置,用于实现:采用基于模型子空间的二级匹配方法,处理过程分为两个步骤:第一步通过粗筛定位子空间,确定待检音频模型空间所属范围,第二步细匹,即在子空间内部通过精度较高的传统算法命中目标模型,即包括特征提取、聚类计算、子空间划分、中心点计算四个过程。本发明的有益效果为:实现简单,耗时较小,对于数量巨大的模型特征,其实时性足以满足业务需求,可任意调整簇数的取值,能够有效的划分子空间,并且能够较为均匀的划分到不同的子空间中,同时缩小了模型匹配范围,单次语音特征比较能够有效降低模型数量,提高了效率。
-
公开(公告)号:CN110047509B
公开(公告)日:2021-04-02
申请号:CN201910240865.8
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种两级子空间划分方法及装置,用于实现:采用基于模型子空间的二级匹配方法,处理过程分为两个步骤:第一步通过粗筛定位子空间,确定待检音频模型空间所属范围,第二步细匹,即在子空间内部通过精度较高的传统算法命中目标模型,即包括特征提取、聚类计算、子空间划分、中心点计算四个过程。本发明的有益效果为:实现简单,耗时较小,对于数量巨大的模型特征,其实时性足以满足业务需求,可任意调整簇数的取值,能够有效的划分子空间,并且能够较为均匀的划分到不同的子空间中,同时缩小了模型匹配范围,单次语音特征比较能够有效降低模型数量,提高了效率。
-
公开(公告)号:CN111669757B
公开(公告)日:2023-03-14
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN110175221B
公开(公告)日:2021-04-20
申请号:CN201910411018.3
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: G06F16/33 , G06F40/289 , G06N3/04
Abstract: 利用词向量结合机器学习的垃圾短信识别方法,所述方法包括下列操作步骤:(1)根据短信特征对垃圾短信进行第一步识别;(2)根据关键词对垃圾短信进行第二步识别;(3)计算短信的短信文本向量,使用支持向量机的方法对垃圾短信进行第三步识别;(4)计算短信的静态词向量矩阵,利用卷积神经网络对垃圾短信进行第四步识别;(5)计算短信的每一个分词的动态词向量,利用卷积神经网络对垃圾短信进行第五步识别。本发明方法采用无监督和有监督相结合的垃圾短信识别方法,能大幅度提高垃圾短信的识别准确率。
-
公开(公告)号:CN111669757A
公开(公告)日:2020-09-15
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN110188805A
公开(公告)日:2019-08-30
申请号:CN201910414965.8
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: G06K9/62
Abstract: 一种诈骗群体的识别方法,包括有:步骤一、提取每对疑似诈骗号码和受害人号码之间的通话和短信话单,分别构建通话特征向量和短信特征向量,将所有疑似诈骗号码和受害人号码的通话特征向量和短信特征向量输入诈骗行为特征提取模型,从而获得每对疑似诈骗号码和受害人号码的诈骗特征指纹;其中,诈骗特征指纹用于标识每对疑似诈骗号码和受害人号码之间的诈骗行为程度;步骤二、根据每对疑似诈骗号码和受害人号码的诈骗特征指纹,识别每两个疑似诈骗号码之间的区别度,并将相互之间区别度低的疑似诈骗号码构成一个诈骗群体。本发明属于信息技术领域,能基于通话和短信话单,全面且准确的识别由诈骗行为接近的诈骗号码所构成的诈骗群体。
-
公开(公告)号:CN109587350A
公开(公告)日:2019-04-05
申请号:CN201811373658.1
申请日:2018-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04M3/22 , H04W12/12 , H04W16/22 , G06F16/2458
Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K-Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K-Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。
-
公开(公告)号:CN109274836A
公开(公告)日:2019-01-25
申请号:CN201811287123.2
申请日:2018-10-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。
-
公开(公告)号:CN110830999B
公开(公告)日:2023-04-07
申请号:CN201910991032.5
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 杭州东信北邮信息技术有限公司
IPC: H04W12/041 , H04W12/122
Abstract: 一种呼叫处置策略的加密方法,包括:管理装置使用非对称加密算法生成公钥和私钥,并将公钥提供给通讯业务服务器上的控制装置;管理装置将诈骗电话呼叫处置策略通过公钥进行加密,策略包括可疑诈骗号码数据和可疑诈骗号段数据,其中,可疑诈骗号码数据是使用公钥加密后的可疑诈骗号码,可疑诈骗号段数据由可疑诈骗号段长度和加密后的可疑诈骗号段组成,然后将呼叫处置策略同步至控制装置;控制装置从触发至业务服务器的呼叫中提取号码,将提取号码和呼叫处置策略进行匹配,当匹配一致时,则表示该呼叫是可疑诈骗电话,对呼叫处理。本发明属于信息技术领域,能保证呼叫处置策略中可疑诈骗号码和号段数据的安全性,防止敏感数据泄露。
-
公开(公告)号:CN110556114B
公开(公告)日:2022-06-17
申请号:CN201910684343.7
申请日:2019-07-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: G10L17/18 , G10L17/04 , H04M1/656 , H04M1/72454 , H04M1/72403
Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置,包括如下步骤:采集多个被测试通话人的通话录音和测试通话人的通话录音;根据所述被测试通话人对应的通话录音,建立通话人语音库;采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型;存储所述测试通话人的通话录音,获得录音文件;将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型,采用训练模型识别所述被测试通话人,确认了拨号码对应的主人的一致性,避免了由于通话人身份被仿冒带来的通信安全隐患,进一步提高了通话过程中的信息的安全性。
-
-
-
-
-
-
-
-
-