-
公开(公告)号:CN113239663B
公开(公告)日:2022-07-12
申请号:CN202110309085.1
申请日:2021-03-23
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/126 , G06F40/216 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于知网的多义词中文实体关系识别方法,其步骤包括:1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化,得到每一个字对的字颗粒度向量;然后对每一字颗粒度向量所在的位置信息进行编码,得到语料中每个字与预标注的待识别实体关系对的相对位置编码;2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合;3)基于知网生成每一语料的词颗粒度语义向量集合;4)利用各语义向量及其对应位置编码训练深度自注意力神经网络,得到深度自注意力神经网络编码器;5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器,得到该待处理语料中的实体关系。
-
公开(公告)号:CN109033166B
公开(公告)日:2022-01-07
申请号:CN201810636331.2
申请日:2018-06-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211
Abstract: 本发明公开了一种人物属性抽取训练数据集构建方法。首先,下载HTML页面中的文本数据内容,提取描述人物正文内容和属性信息的信息框数据,并进行编码存储和语句切分;然后,对切分后的语句,选取既包含人物名称、人物属性值内容的语句构建人物属性抽取语料数据集;最后,提取人物属性抽取语料数据集中的所有动词,基于信息熵的方法对所有动词进行排序,提取排名靠前的动词作为属性触发词,把人物属性抽取语料数据集中不包含属性触发词的语句删除掉,剩下的语句就组成了人物属性抽取训练数据集。本发明综合利用的网页数据采集、词性分析、词语信息熵计算等技术自动构建人物属性抽取训练数据集,对提高训练数据集构建的效率具有重要意义。
-
公开(公告)号:CN113255720A
公开(公告)日:2021-08-13
申请号:CN202110393842.8
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06Q50/00 , G06F16/901
Abstract: 本发明公开了一种基于分层图池化的多视角聚类方法,包括以下步骤:将待处理数据划分成多视角数据集,然后将多视角数据集按各视角构建对应的图表示,得到对应的视图;采用分层图池化层迭代计算方法提取每个视图的聚类信息,每个视图的聚类信息包括对应该视图的粗化图和分配矩阵,该粗化图包括迭代后的邻接矩阵、特征矩阵、图拉普拉斯矩阵;采用多视角谱聚类融合方法融合所有视图的聚类信息,得到每一类特征向量所对应的类别。具有充分利用待处理数据本身的多视图特征,可以综合包含原各个视图的聚类信息。公开了一种基于分层图池化的多视角聚类系统,包括:图构建模块、聚类信息计算提取模块、多视角融合模块。本发明具有提升聚类效果的有益效果。
-
公开(公告)号:CN111949848A
公开(公告)日:2020-11-17
申请号:CN202010785632.9
申请日:2020-08-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9536 , G06F16/958 , G06F16/35 , G06F40/295 , G06F40/216
Abstract: 本发明涉及一种基于特定事件的跨平台传播态势评估及分级方法,属于网络信息领域。本发明的基于特定事件的跨平台传播态势评估及分级方法,具体包括四个功能模块,分别为:原始网络元素检测模块、特定事件的话题传播计算模块、话题传播模型参数的等级评定和威胁分析模块、任务调度和优化模块。本发明解决了现有技术中没有考虑到事件的传播态势评估及分级方法,提出了针对特定事件传播情况的量化评估方法和有区分度的分级手段,建立了信息系统框架,实现了对特定事件的跨平台传播态势评估及分级,同时根据特定事件的跨平台传播态势评估对后续监测工作进行指导,从而有效提高对于事件传播的紧急或影响程度的判断能力,用以指导实际工作。
-
公开(公告)号:CN110134944A
公开(公告)日:2019-08-16
申请号:CN201910275651.4
申请日:2019-04-08
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了一种基于强化学习的指代消解方法,包括:数据预处理:对文本数据进行分词、分句、词性标注、词形还原、命名实体识别、句法解析,词向量转换,得到候选先行词和指代词相关特征;构建神经网络模型:该模型结合词向量和相关特征能够学习指代对的特点和相关语义信息,更好的对候选先行词和指代词进行排序打分,最后得到指代链;使用训练好的模型进行指代消解,输入文本数据,输出消解链。本发明方法针对启发式损失函数的不足,采用奖励衡量的机制来进行深度学习训练,提高了模型效果,针对不同语言数据集自动进行超参设置,免除了手工设置的必要,提高了模型的实用性拓展了适用范围。
-
公开(公告)号:CN105791039B
公开(公告)日:2019-02-26
申请号:CN201410811870.7
申请日:2014-12-22
Applicant: 北京启明星辰信息安全技术有限公司 , 国家计算机网络与信息安全管理中心 , 北京启明星辰信息技术股份有限公司
Abstract: 本发明公开了一种基于特征片段自发现的可疑隧道检测方法和系统,包括基于特征片段锁定算法锁定特征片段集合并找出最邻近片段集合;在可疑隧道检测过程中,实时提取元数据片段,基于片段间最小距离搜索算法分别计算元数据片段与特征片段集合和最邻近片段之间的最小距离,计算可疑元数据片段的判定参数,当判定参数的结果小于零时,判定元数据片段为可疑片段并报警;当大于或等于零时,为非可疑片段。通过本发明的方案,能够同时具备误用检测技术的自解释能力和异常检测技术的发现未知可疑隧道的优点,避免了网络安全专家的大量精力投入,回避了统计特征被平均化的问题。
-
公开(公告)号:CN108616400A
公开(公告)日:2018-10-02
申请号:CN201810437213.9
申请日:2018-05-09
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种针对工业控制系统的脆弱性检查方法与装置,配置威胁发现检测系统,进而有数据发送端口与数据接收端口建立威胁检测的通道,通过自动的与客户端互联,接收客户端的指令或操作指令,根据操作指令自动调用对应的应用于测试用例,对待测设备进行威胁检测、可用性检测、兼容性检测,威胁包括但不限于待测工业控制系统给其他设备带来的威胁、其他设备对待测工业系统设备的威胁。本发明采用为增强工业控制系统的安全性,对现存的已知漏洞进行发现,进而做到知己知彼的目的,提前进行预防。
-
公开(公告)号:CN108600260A
公开(公告)日:2018-09-28
申请号:CN201810436596.8
申请日:2018-05-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京信联科汇科技有限公司
Abstract: 本发明公开了一种工业物联网安全配置核查方法,由四个系统层组成的方法包括:基础平台层A,系统处理层B,核心服务层C和对外接入层D,基础平台层A包括专用硬件平台A1和基础软件平台A2,所述专用硬件平台A1包含了为该系统提供计算、存储、对外通信的硬件设备;基础软件平台A2包含了该系统专用操作系统、文件系统、硬盘加解密、程序加解密、网络服务、数据库、Web服务、等程序运行环境,系统处理层B包括数据处理B1和系统服务B2,所述数据处理B1为系统内部接口,提供系统访问数据库,访问系统文件,数据同步,输入输出处理等底层数据处理业务。同时数据处理可实现高效访问数据库,缓存数据,高并发。
-
公开(公告)号:CN107784387A
公开(公告)日:2018-03-09
申请号:CN201710843010.5
申请日:2017-09-18
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06Q10/04 , G06F17/30675 , G06Q50/01
Abstract: 本发明公开了一种微博事件信息传播的连续动态预测方法,属于数据挖掘领域。针对新浪微博,在目前给定传播信息的基础上,试图预测下一阶段的微博总数量;按小时划分事件传播,利用事件从发生到当前时间段内传播特征,如微博量、参与人数、微博情绪等,基于GBDT模型预测下一小时内事件微博传播的总数。本发明预测模型中最优时间段长度和微博特征组合,是在全面衡量各特征的贡献度和相关性的基础上筛选出来的,不仅能够有效提高模型预测精度,平均模型精度超过70%,还能减小计算复杂性,避免无用计算,有效支持针对事件的预警和干预措施。
-
公开(公告)号:CN105791039A
公开(公告)日:2016-07-20
申请号:CN201410811870.7
申请日:2014-12-22
Applicant: 北京启明星辰信息安全技术有限公司 , 国家计算机网络与信息安全管理中心 , 北京启明星辰信息技术股份有限公司
Abstract: 本发明公开了一种基于特征片段自发现的可疑隧道检测方法和系统,包括基于特征片段锁定算法锁定特征片段集合并找出最邻近片段集合;在可疑隧道检测过程中,实时提取元数据片段,基于片段间最小距离搜索算法分别计算元数据片段与特征片段集合和最邻近片段之间的最小距离,计算可疑元数据片段的判定参数,当判定参数的结果小于零时,判定元数据片段为可疑片段并报警;当大于或等于零时,为非可疑片段。通过本发明的方案,能够同时具备误用检测技术的自解释能力和异常检测技术的发现未知可疑隧道的优点,避免了网络安全专家的大量精力投入,回避了统计特征被平均化的问题。
-
-
-
-
-
-
-
-
-