-
公开(公告)号:CN113286035B
公开(公告)日:2022-12-30
申请号:CN202110529065.5
申请日:2021-05-14
Applicant: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
Inventor: 刘发强 , 张震 , 石瑾 , 李鹏 , 刁则鸣 , 黄远 , 仇艺 , 张梦影 , 袁堂岭 , 尚程 , 阿曼太 , 梁彧 , 蔡琳 , 杨满智 , 王杰 , 田野 , 金红 , 陈晓光 , 傅强
Abstract: 本发明实施例公开了一种异常呼叫检测方法、装置、设备及介质。该方法包括:获取多种类型的通话记录描述数据;根据各通话记录描述数据形成至少一个多源数据分组,多源数据分组中包括至少两种类型的通话记录描述数据;将每个多源数据分组中包括的各通话记录描述数据进行关联分析,形成与每个多源数据分组分别对应的异常呼叫检测结果。在上述技术方案中,通过对多种类型的通话记录描述数据进行关联分析,得到异常呼叫检测结果,实现了有效地对异常呼叫进行安全监管,提高了异常呼叫的检测精确度。
-
公开(公告)号:CN105824801B
公开(公告)日:2018-06-15
申请号:CN201610150794.9
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。
-
公开(公告)号:CN113420123B
公开(公告)日:2025-01-14
申请号:CN202110705729.9
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/3329 , G06F16/334 , G06F18/214 , G06N3/02
Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置,包括:获取训练样本集;训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签;复制语言模型得到教师语言模型,将语言模型作为学生语言模型;将第二任务标签输入至教师语言模型中,生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签;将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中,生成第一预测文本、第一预测结果、第二预测文本和第二预测结果,对学生语言模型进行训练。根据本申请实施例,能够解决相关技术中存储资源占用大的问题。
-
公开(公告)号:CN118332103A
公开(公告)日:2024-07-12
申请号:CN202410507046.6
申请日:2024-04-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/34 , G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/084
Abstract: 本公开提供一种主题提取方法、装置、相关设备和计算机程序产品,涉及计算机与互联网技术领域。主题提取方法包括:获取多个文本和多个热点关键词,热点关键词是从网络中获得的;根据多个热点关键词对各个文本分别进行关键词匹配,以确定各个文本中的文本关键词;通过文本关键词对多个文本进行文本聚类,以确定至少一个文本组;将每个文本组中命中热点关键词最多的文本作为文本组的主题。本公开实施例可以快速且准确的从多个文本中提取出主题信息。
-
公开(公告)号:CN116775943A
公开(公告)日:2023-09-19
申请号:CN202310498578.3
申请日:2023-05-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/901 , G06F16/906 , G06F18/25 , G06N3/088
Abstract: 本发明公开了一种基于图挖掘的电信异常检测方法。克服了现有技术在进行电信异常检测时检测效率低和检测不够精准等问题。检测方法对通联记录数据处理后组织成图,将图由全图划分成一系列子图,进行图表征的局部学习和全局学习,获得节点级别的本地表征和子图级别的全局表征,通过异常检测算法得到每个子图的异常得分,选取异常得分最高的部分子图,通过异常检测算法得到这些子图中每个节点的异常得分,取异常得分最大的部分节点作为最终检测结果输出。此检测方法能实现大规模图中电信异常行为高效准确的检测。
-
公开(公告)号:CN115083422A
公开(公告)日:2022-09-20
申请号:CN202210859678.X
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种语音溯源取证方法及装置、设备及存储介质,所述方法包括:本提取待测试语音的至少两种不同的声学特征;对提取的待测试语音的至少两种不同的声学特征进行融合,得到第一融合声学特征;基于预先训练的语音溯源取证模型,从所述第一融合声学特征中提取帧级别的算法指纹特征,对帧级别的算法指纹特征进行池化平均,根据池化平均得到的特征加权平均向量和加权标准差向量计算段级别的算法指纹特征,以基于段级别的算法指纹特征预测出待测试语音的生成算法;将预测出的待测试语音的生成算法作为语音溯源取证结果,通过提取算法指纹,不仅可以判断音频的真实性,而且可以进一步溯源取证,得到虚假音频的生成来源。
-
公开(公告)号:CN114936723A
公开(公告)日:2022-08-23
申请号:CN202210856300.4
申请日:2022-07-21
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及数据挖掘技术领域,公开了一种基于数据增强的社交网络用户属性预测方法及系统,该属性预测方法,基于用户的历史行为序列,推断用户未来一段时间的行为序列,通过将历史行为序列与预测得到的行为序列进行拼接,扩大行为序列的长度,对用户的行为数据进行增强。本发明解决了现有技术存在的线网络用户行为序列长度较短时不能为用户属性预测任务提供足够信息、从而导致用户属性预测的预测准确性低的问题。
-
公开(公告)号:CN113420123A
公开(公告)日:2021-09-21
申请号:CN202110705729.9
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06K9/62 , G06N3/02
Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置,包括:获取训练样本集;训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签;复制语言模型得到教师语言模型,将语言模型作为学生语言模型;将第二任务标签输入至教师语言模型中,生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签;将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中,生成第一预测文本、第一预测结果、第二预测文本和第二预测结果,对学生语言模型进行训练。根据本申请实施例,能够解决相关技术中存储资源占用大的问题。
-
公开(公告)号:CN113420121A
公开(公告)日:2021-09-21
申请号:CN202110704938.1
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06K9/62
Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。
-
公开(公告)号:CN109960756B
公开(公告)日:2021-04-09
申请号:CN201910207437.5
申请日:2019-03-19
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/953 , G06F16/34 , G06F16/35 , G06F40/211
Abstract: 本发明公开了一种新闻事件信息归纳方法,包括:收集新闻素材,创建新闻库;从新闻库中获取目标事件的所有新闻文本,并进行热度分析,获取拐点新闻文本,抽取所述拐点新闻文本中的事件信息并保存;其中,获取拐点新闻文本的方法包括:统计所有新闻文本的热度值,按照新闻文本发布的时间顺序排序,构建热度值随时间变化的曲线图,取曲线图的所有极大点对应的新闻文本,即为所述拐点新闻文本,所述热度值为新闻的页面浏览量和网站独立访客量之和。本发明的方法通过选择对于目标新闻事件处于关键节点时的新闻文本——即拐点新闻文本进行摘要分析处理,准确地反映了新闻事件的发展态势。
-
-
-
-
-
-
-
-
-