-
公开(公告)号:CN110942783B
公开(公告)日:2022-06-17
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN108460772B
公开(公告)日:2022-05-17
申请号:CN201810150076.0
申请日:2018-02-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06T7/11 , G06T7/136 , G06T7/155 , G06V10/764 , G06K9/62
Abstract: 本发明提供了一种基于卷积神经网络的广告骚扰传真图像检测系统及方法,包括关键字区域提取模块,所述关键字区域提取模块用于确定待检测传真图像的关键字可疑区域;神经网络置信度分析模块,所述神经网络置信度分析模块与所述关键字区域提取模块相连,所述神经网络置信度分析模块用于对所述关键字可疑区域的文字进行识别,实现传真图像的分类。本发明通过关键字区域提取模块对关键字可疑区域进行提取,自动化运行,工作效率高;通过神经网络置信度分析模块对关键字可疑区域的文字进行识别,实现广告骚扰传真的分类判断,节约时间,管控能力强,使得本发明具有工作效率高,管控能力强的特点。
-
公开(公告)号:CN113779961A
公开(公告)日:2021-12-10
申请号:CN202010518026.0
申请日:2020-06-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/253 , G06F40/289
Abstract: 本发明提供一种自然语言文本的惯用句式提取方法及电子装置,包括:对采集到的每一语句进行分词、词性标注及依存句法分析;将各语句转换为若干单句,并依据词性标注结果与依存句法分析结果,对各单句主干进行抽取,将各单句表示为词汇和词性标签的列表;将各单句的列表进行合并,得到各语句的惯用句式。本发明提出一种不损失句式信息的长难句化简方法,针对句式提取的需要对中文长难句中非句子主干部分进行处理,提高句式提取准确度,本发明还提出一种句式信息表示结构,使用词汇、词汇候选集、词性标签来表示句式信息,保留尽可能多的句式信息。
-
公开(公告)号:CN109920406B
公开(公告)日:2021-12-03
申请号:CN201910245435.5
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种基于可变起始位置的动态语音识别方法及系统,用于实现:实时加载输入的语音流信号,对语音信号进行预处理;对语音信号进行特征提取,获取语音信号中的特征;根据语音信号中的特征调用语音模型信息库的多个模型对语音信号进行逐帧模式匹配。本发明的有益效果为:本发明的有益效果为容易理解,实现简单,当前语音模型匹配选取长度较为合理,经过算法改进后,减少了语音模型匹配次数,语音识别效率比之前的算法提高了30%的效率。
-
公开(公告)号:CN110248322B
公开(公告)日:2021-10-22
申请号:CN201910572375.8
申请日:2019-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: H04W4/14 , H04W12/128
Abstract: 本发明涉及一种基于诈骗短信的诈骗团伙识别方法及识别系统,该识别方法包括:实时识别并提取诈骗短信的敏感信息;对该诈骗短信进行通联关系分析,获取预定时间范围内所有相关通讯数据;从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息;根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本。本发明提取诈骗短信的敏感信息,并获取与诈骗短信同一主叫的有关语音信息进行分析,从而获取以多种方式向被叫信息发送敏感信息的所有主叫信息和主叫语音,对所有主叫信息进行整体分析,以获取诈骗团伙的诈骗地区、诈骗时间、团伙成员等,实现诈骗团伙识别的自动化。
-
公开(公告)号:CN113205801A
公开(公告)日:2021-08-03
申请号:CN202110498059.8
申请日:2021-05-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本申请涉及一种恶意语音样本的确定方法、装置、计算机设备和存储介质。该方法包括:获取初始语音样本集;根据预设的多种恶意类别对初始语音样本集进行分类,得到多种恶意类别中每种恶意类别对应的语音样本子集;根据每种恶意类别对应的语音样本子集中的语音样本信息,计算每种恶意类别对应的语音样本子集的恶意度;将恶意度满足预设恶意度条件的恶意类别对应的语音样本子集中的语音样本,确定为恶意语音样本。本方法基于语音样本子集的恶意类别以及恶意度可自动确定恶意语音样本,有利于提高恶意语音样本的确定效率。
-
公开(公告)号:CN112435672A
公开(公告)日:2021-03-02
申请号:CN202011105330.9
申请日:2020-10-15
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种声纹识别方法、装置、设备及存储介质,该方法包括:获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份;响应于所述用户身份识别成功,执行所述登录执行。本发明针对如何解决由于传统声纹识别算法的局限性,通过获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份,提高音频数据进行登录验证的准确率。
-
公开(公告)号:CN109587350A
公开(公告)日:2019-04-05
申请号:CN201811373658.1
申请日:2018-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04M3/22 , H04W12/12 , H04W16/22 , G06F16/2458
Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K-Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K-Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。
-
公开(公告)号:CN109359126A
公开(公告)日:2019-02-19
申请号:CN201811009136.3
申请日:2018-08-30
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/242 , G06F16/2453
Abstract: 本发明属于数据查询技术领域,具体而言,涉及一种基于业务用户习惯的智能学习查询模型的构建方法,包括如下步骤:S1、从数据源中获取业务用户的数据查询记录;S2、根据步骤S1中得到的所述数据查询记录,进行数据查询习惯分析;S3、根据步骤S2中得到的数据查询习惯分析结果构建查询模型。本发明还提供了一种基于业务用户习惯的智能学习查询系统。本发明通过对业务用户的数据查询习惯进行分析,针对分析结果制定数据查询方案,构建查询模型,能够提前将业务用户关注的数据推送给业务用户,具有查询时间短、用户体验效果好的特点。
-
公开(公告)号:CN109274836A
公开(公告)日:2019-01-25
申请号:CN201811287123.2
申请日:2018-10-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。
-
-
-
-
-
-
-
-
-