-
公开(公告)号:CN110059181B
公开(公告)日:2021-06-25
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
公开(公告)号:CN105608107A
公开(公告)日:2016-05-25
申请号:CN201510744625.3
申请日:2015-11-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30905
Abstract: 本发明公开了一种基于舆情大数据的视觉展示方法。获取舆情大数据的数据变化值;确定用于显示所述数据的变化值的时间长度;根据所述数据的变化值和时间长度,确定所述立体模型的变化速度。本发明能够形象地展示数据的变化值和变化速度,从而将数据的变化以视觉变化来展现,增强了使用者和浏览的用户的视觉体验。
-
公开(公告)号:CN115225304B
公开(公告)日:2023-05-05
申请号:CN202210295287.X
申请日:2022-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京信息科技大学
IPC: H04L9/40 , H04L41/147 , G06N7/01
Abstract: 本发明涉及一种基于概率图模型的网络攻击路径预测方法及系统,其方法包括:S1:获取已有的网络安全知识图谱,利用表示学习将网络实体节点转换为向量,计算向量在欧式空间中的相似度作为网络实体节点状态转移概率;其中网络实体节点包括:APT组织、威胁指标、安全漏洞和网络资产;S2:利用贝叶斯网络,基于网络实体节点状态转移概率,计算网络实体节点的联合概率分布,选择联合概率最大的攻击链路作为最可信的网络攻击路径。本发明提供的方法,构建网络安全实体之间的关系图谱,解决了因多源异构网络安全实体难以建模的难题,极大地提高了预测APT潜在攻击路径的能力。
-
公开(公告)号:CN111737551B
公开(公告)日:2022-08-05
申请号:CN202010452949.0
申请日:2020-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/951 , G06N3/08 , G06N3/04
Abstract: 本发明公开一种基于异构图注意力神经网络的暗网线索检测方法:步骤一、对暗网进行文本采集;步骤二、针对采集到的暗网文本信息,进行事件标题、关键词及实体提取,构建动态异构信息网络;步骤三、对构建的异构信息网络中的节点进行embedding处理,并得到各节点的特征向量;步骤四、对异构信息网络的图结构进行学习;步骤五、根据对异构信息网络的图结构学习得到的结果,对异构信息网络中的节点进行线索类别分类,从而完成对暗网信息的线索检测。本发明利用了外部知识库作为依托,并且采用了两套方法来对构建的异构信息网络的图结构进行学习,具有良好的线索检测效果。
-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN111597333A
公开(公告)日:2020-08-28
申请号:CN202010343965.6
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9535 , G06F40/30 , G06F40/289 , G06Q50/26
Abstract: 本发明公开一种面向区块链领域的事件与事件要素抽取方法及装置,该方法包括:步骤一、基于区块链关键词图的web文本聚类,得到区块链文本聚合词图;步骤二、基于所述的区块链文本聚合词图,构建图注意力机制的图表示学习的事件及其要素抽取方法;首先以区块链文本聚合词图作为输入,基于图注意力模型GAT的深度学习模型进行词的表示学习,以事件及其要素进行抽取的模型训练直到模型收敛;基于收敛的模型实现Tensorflow的后台接口,而对于新的待抽取的文本通过该后台接口进行预测,返回输出的抽取值。本发明可以准确提取事件及其事件要素。
-
-
-
-
-