-
公开(公告)号:CN109920406B
公开(公告)日:2021-12-03
申请号:CN201910245435.5
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种基于可变起始位置的动态语音识别方法及系统,用于实现:实时加载输入的语音流信号,对语音信号进行预处理;对语音信号进行特征提取,获取语音信号中的特征;根据语音信号中的特征调用语音模型信息库的多个模型对语音信号进行逐帧模式匹配。本发明的有益效果为:本发明的有益效果为容易理解,实现简单,当前语音模型匹配选取长度较为合理,经过算法改进后,减少了语音模型匹配次数,语音识别效率比之前的算法提高了30%的效率。
-
公开(公告)号:CN113255918A
公开(公告)日:2021-08-13
申请号:CN202110393843.2
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N5/04 , G06F16/36 , G06N5/02 , G06K9/62 , G06F40/126
Abstract: 本发明公开了一种强化聚合知识指导的生成常识推理方法,包括:基于知识图谱构建概念推理图和分层概念扩展图;搭建强化聚合指导下基于概念推理图的知识图谱增强型编码器;搭建强化聚合指导下基于分层概念扩展图的知识图谱增强型解码器;训练包含知识图谱增强型编码器和知识图谱增强型解码器的生成常识推理模型;应用训练后的生成常识推理模型生成常识推理语句。本发明提供的方法可以有效避免因未考虑概念之间关系而导致生成语句不符合日常情景、逻辑不合理等一系列问题,通过引入强化聚合过程从知识图谱中筛选能提供丰富关系信息的附加概念描述,有效提升了模型对不可见概念集的概括。
-
公开(公告)号:CN113220964A
公开(公告)日:2021-08-06
申请号:CN202110357064.7
申请日:2021-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9032 , G06F16/955 , G06F40/242 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明属于网络信息以及自然语言处理技术领域,特别涉及一种基于网信领域短文本的观点挖掘方法。本方法包括网信领域相关的数据获取与预处理模块、基于短文本的特征提取模块、短文本属性推断模块、观点挖掘结果输出模块。本发明方法提出了基于网信领域的短文本获取与数据清洗模型,建立了面向社交网络短文本的文本特征提取模型,设计了基于网信领域的社交网络短文本的属性推断模型,综合考虑了文本关键词抽取和摘要生成,提出对应的观点挖掘输出模型,最终基于实际采集的网络安全法相关短文本数据实现输出及可视化的展示。本发明极大地减少了人工收集、分析与网信领域相关的短文本的时间成本,能够有效的为网信领域相关专业人士提供观点挖掘结果。
-
公开(公告)号:CN112214558A
公开(公告)日:2021-01-12
申请号:CN202011296138.2
申请日:2020-11-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种主题相关度判别方法及装置,方法包括:对获取的网页构建网页特征向量;利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算;筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点,相比于现有技术,可以实现较高的判别精度,并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。
-
公开(公告)号:CN111858728A
公开(公告)日:2020-10-30
申请号:CN202010605313.5
申请日:2020-06-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/25
Abstract: 本发明公开了不同数据源的数据抽取方法,包括:获取数据源和数据源属性名,计算数据源属性名与预设属性名的相似度,若所述相似度大于预设阈值,则建立所述数据源属性名与所述预设属性名的映射关系,构建属性名映射表;根据所述属性名映射表,获取与所述预设属性名对应的不同数据源,根据数据源的优先级,按照设定的抽取规则抽取数据入库;以及,不同数据源的数据抽取装置,设备和存储介质。本发明通过自动化创建属性名映射表,可以对不同数据源的数据进行自动抽取,高效地构建不同领域的知识库并自动化更新,成本低。
-
公开(公告)号:CN111353300A
公开(公告)日:2020-06-30
申请号:CN202010093817.3
申请日:2020-02-14
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/289 , G06K9/62
Abstract: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
公开(公告)号:CN104408659A
公开(公告)日:2015-03-11
申请号:CN201410592639.3
申请日:2014-10-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q50/00
CPC classification number: G06Q50/01 , G06Q10/0635
Abstract: 本发明公开了一种基于社交应用信息传播模式的评估方法及系统。该方法包括:对社交应用的信息传播过程进行分析和抽象,建立社交应用信息传播模式;基于社交应用信息传播模式,按照层次关系将社交应用信息传播风险分解为各项因素,并根据各项因素间的相互关系将各项因素按照层次关系进行聚集组合,生成虚假信息传播风险评估模型;其中,虚假信息传播风险评估模型的层次关系具体包括:系统层、实体层、以及风险点层;以虚假信息传播风险评估模型的风险点层中的风险点为基础原始数据,对该社交应用面临的虚假信息传播威胁进行评估。
-
-
-
-
-
-