-
公开(公告)号:CN112214558B
公开(公告)日:2023-08-15
申请号:CN202011296138.2
申请日:2020-11-18
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本申请提供了一种主题相关度判别方法及装置,方法包括:对获取的网页构建网页特征向量;利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算;筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点,相比于现有技术,可以实现较高的判别精度,并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。
-
公开(公告)号:CN113313379A
公开(公告)日:2021-08-27
申请号:CN202110586002.3
申请日:2021-05-27
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06Q10/06
摘要: 本发明提供一种确定事件角色影响力指数的方法、装置及存储介质,包括:对各角色类别中的角色个体划分为一级指标和二级指标;根据角色类别及特定限制信息,提取所有满足所述限制信息的角色个体对应的二级指标中各指标的数值,计算并形成信息矩阵;对所提取形成的信息矩阵,利用熵权法计算二级指标的权重;针对二级指标权重利用变异系数法计算一级指标权重;将每个二级指标权重与其对应一级指标权重相乘,得到每个二级指标的综合权重;将目标角色个体的各二级指标对应的值与每个二级指标的综合权重相乘求和,得到所述目标角色个体的影响力指数。通过本发明的方法,能够计算出事件角色影响力,用于各领域角色影响力量化分析。
-
公开(公告)号:CN111694952A
公开(公告)日:2020-09-22
申请号:CN202010299741.X
申请日:2020-04-16
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F16/31 , G06F16/335
摘要: 本发明公开了一种基于微博的大数据分析模型系统及其实现方法,该实现方法包括以下步骤:步骤1、首先对收集的数据进行清洗和预处理工作,然后对数据进行人工标注;步骤2、模型训练阶段,采用SVM、cnnrnn结合Bert预训练模的方式进行模型训练;步骤3、在次人工标注的训练集上进行模型训练;步骤4、通过对比真实数据标签和预测结果,不断迭代优化通过不断的迭代优化参数调优的方式得到最佳模型;步骤5、在海量的文章中聚类,通过simHash算法,对文章内容进行局部HASH;步骤6、把选择出来的HASH对应的文章查询出来,再通过机器学习的算法进行聚类。本发明能够在保证模型准确率的基础上可以有效地减少机器需求,提高模型的准确率以及鲁棒性。
-
公开(公告)号:CN101924754B
公开(公告)日:2013-07-31
申请号:CN201010227324.0
申请日:2010-07-15
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04L29/06
摘要: 本发明公开了一种恶意代码控制端主动发现方法,包括:主机信息扫描步骤,用于在需要扫描的IP地址范围内,找出处于在线状态,操作系统为Windows,且具有开放端口的主机并确定其至少一个开放端口;控制端信息扫描步骤,与所述主机的开放端口建立网络连接,模拟已知的恶意代码控制端类型对应的被控端主机的网络行为,向所述主机发送数据,并对接收到的返回数据进行分析,若符合所述已知恶意代码控制端类型的特征,则认为所述主机中存在所述恶意代码控制端类型。采用本发明方法能够有效识别恶意代码控制端,适用于对因特网中的主机进行大规模扫描,对信息安全保障具有重大的现实意义。本发明还相应提供了一种恶意代码控制端主动发现装置。
-
公开(公告)号:CN111930957A
公开(公告)日:2020-11-13
申请号:CN202010598739.2
申请日:2020-06-28
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明实施例公开了实体间亲密度的分析方法、装置、电子设备以及存储介质。所述方法包括:获取知识图谱中的多个实体以及所述多个实体之间的关系;根据所述多个实体中两个实体与所述多个实体中的其他实体之间的关系,确定所述两个实体之间的关系关联度;根据所述两个实体之间的关系关联度,确定所述两个实体之间的亲密度。基于该方法和装置,可以从实体间关系维度对实体间亲密度的分析,提高了实体间亲密度分析的全面性。
-
公开(公告)号:CN111861144A
公开(公告)日:2020-10-30
申请号:CN202010605353.X
申请日:2020-06-29
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明公开了面向多维指标分析的评估方法,包括:获取预定地区的产业发展相关指标的数据,所述产业发展相关指标至少包括产业指标、科研机构指标及政策法规指标;对所述产业发展相关指标的数据执行无量纲化处理;根据无量纲化处理得到的数据,计算所述产业发展相关指标的熵值,根据所述熵值计算所述产业发展相关指标的权值;根据无量纲化处理得到的数据和权值,评估预定地区的产业发展。本发明还提供了面向多维指标分析的评估装置。本发明通过对多个角度的指标数据信息进行获取和计算,实现了全方面、多维度、快速评估。
-
公开(公告)号:CN111461348A
公开(公告)日:2020-07-28
申请号:CN202010264622.0
申请日:2020-04-07
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明涉及一种基于图核的深度网络嵌入学习模型,包括构造节点的子结构集合、生成子结构的特征向量、在多个重构核希尔伯特空间上近似特征向量、设计基于图核的深度卷积模型、提出一种挖掘潜在社区信息的优化方法5个部分;本发明综合利用了社交网络分析、图算法分析、机器学习等技术,为网络的节点生成高质量表征向量,进而基于该向量可进行其他应用的研究,对进一步研究社交网络的特性和挖掘相关信息提供了关键基础。
-
公开(公告)号:CN111353300B
公开(公告)日:2023-09-01
申请号:CN202010093817.3
申请日:2020-02-14
申请人: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/284 , G06F40/289 , G06F18/214 , G06F18/241
摘要: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
公开(公告)号:CN113255918A
公开(公告)日:2021-08-13
申请号:CN202110393843.2
申请日:2021-04-13
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06N5/04 , G06F16/36 , G06N5/02 , G06K9/62 , G06F40/126
摘要: 本发明公开了一种强化聚合知识指导的生成常识推理方法,包括:基于知识图谱构建概念推理图和分层概念扩展图;搭建强化聚合指导下基于概念推理图的知识图谱增强型编码器;搭建强化聚合指导下基于分层概念扩展图的知识图谱增强型解码器;训练包含知识图谱增强型编码器和知识图谱增强型解码器的生成常识推理模型;应用训练后的生成常识推理模型生成常识推理语句。本发明提供的方法可以有效避免因未考虑概念之间关系而导致生成语句不符合日常情景、逻辑不合理等一系列问题,通过引入强化聚合过程从知识图谱中筛选能提供丰富关系信息的附加概念描述,有效提升了模型对不可见概念集的概括。
-
公开(公告)号:CN112214558A
公开(公告)日:2021-01-12
申请号:CN202011296138.2
申请日:2020-11-18
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种主题相关度判别方法及装置,方法包括:对获取的网页构建网页特征向量;利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算;筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点,相比于现有技术,可以实现较高的判别精度,并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。
-
-
-
-
-
-
-
-
-