-
公开(公告)号:CN118708728A
公开(公告)日:2024-09-27
申请号:CN202410746389.8
申请日:2024-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/36 , G06F16/33 , G06N5/04 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于难度序列推理的篇章级事件论元抽取方法及系统,属于文本信息抽取领域。本发明根据文档上下文选择对应的提示学习模板,对上下文和提示学习模板进行编码,得到上下文表示和提示表示,该提示表示包含论元角色的向量表示;根据每个论元角色的向量表示计算每个论元角色的预测困难分数,根据预测困难份数对论元角色进行排序,得到预测的推理路径;按照预测的推理路径的顺序进行信息推理,得到每个论元角色的推理概率分布;根据得到的每个论元角色的推理概率分布,预测每个论元角色的位置并抽取论元。本发明能够利用简单论元的信息来帮助抽取困难的论元。
-
公开(公告)号:CN114943073B
公开(公告)日:2024-09-10
申请号:CN202210380497.9
申请日:2022-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京赋乐科技有限公司
IPC: G06F21/46 , G06F21/60 , G06F18/214 , G06F18/20 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06N3/126 , G06N7/01
Abstract: 本公开的实施例提供了加密流量的通用对称加密协议脱壳方法、装置、设备和计算机可读存储介质。所述方法包括获取加密协议的流量;基于预设的密码字典,通过马尔科夫‑GEP模型生成新的密码字典;基于加密协议密码字符组合规律,对所述新的密码字典中的密码进行规约;基于规约后的新的密码字典和传统的解密脱壳方法,构建对称加密协议脱壳模型;将所述加密协议的流量,输入至所述对称加密协议脱壳模型,完成脱壳。提高了脱壳准确度,使得脱壳更加高效。
-
公开(公告)号:CN116795980A
公开(公告)日:2023-09-22
申请号:CN202310440756.7
申请日:2023-04-21
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/0985
Abstract: 本发明公开了一种融合细粒度要素知识的短文本分类方法,该方法包括:通过梳理标注短文本数据完成数据标注,其中,所述数据标注为标注全量标注数据类别和数据中存在要素信息;针对标注后的短文本数据,采用关键要素提取文本分类联合训练算法,借助BERT+CRF提取短文本数据中的要素信息;进而融合细粒度信息,结合标签编码器Label Encoder来学习各个标签label的表示,得到一个符合实际的标签分布。本发明针对上述问题提出一种融合细粒度要素知识的短文本分类的解决方法,从而提升短文本分类的效果,进而促使更为精准分析短文本数据,自动找到有关垃圾信息,提高工作效率。
-
公开(公告)号:CN116561512A
公开(公告)日:2023-08-08
申请号:CN202310431305.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/27 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于COX回归的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;基于COX回归算法,利用当前数据信息,构建COX回归识别模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的COX回归识别模型,对再次获取的表征一主题的数据信息进行识别处理。本发明可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN111143508B
公开(公告)日:2023-04-28
申请号:CN201911244928.3
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/289 , G06F18/23
Abstract: 本发明提出了一种基于通信类短文本的事件检测与跟踪方法,包括:提取与某事件对应的样本集合中各通信类短文本的语义特征、关键要素,及该样本集合的传播网络;根据该语义特征、该关键要素和该传播网络,分别获得任意两个该通信类短文本之间的语义距离、要素距离和用户距离;以该语义距离、该要素距离和该用户距离,获得任意两个该通信类短文本之间的度量距离;对所有该度量距离进行聚类,获得该事件的事件检测结果;提取该事件检测结果的特征属性以跟踪该事件。还提出一种基于通信类短文本的事件检测与跟踪系统,以及一种进行基于通信类短文本的事件检测与跟踪的数据处理装置。
-
公开(公告)号:CN110674290B
公开(公告)日:2023-03-10
申请号:CN201910733074.9
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06Q50/00
Abstract: 本发明提出了一种用于重叠社区发现的关系预测方法、装置和存储介质,用以解决由于获取的用户关系图不够完整,降低了社区发现结果准确性的问题。用于重叠社区发现的关系预测方法,包括:获取用户通信信息中包含的信息内容并分类;确定每一类信息内容中包含的两两信息内容之间的相似度;对于相似度大于预设阈值的两条信息内容,构建该两条信息内容的发送信息用户之间的短时转发关系;构建所述用户通信信息中发送信息用户和接收信息用户之间的收发关系;根据所述短时转发关系和所述收发关系,构建用户关系图;基于所述用户关系图,利用社区发现算法进行社区发现。
-
公开(公告)号:CN115080871A
公开(公告)日:2022-09-20
申请号:CN202210847062.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/901 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了一种跨社交网络社交用户对齐方法,涉及社交网络的用户关系挖掘领域。本发明为了解决现有社交用户对齐方法不能跨社交网络、计算精度低、对齐效率低的缺陷,采用如下步骤实现:采集社交网络的用户属性信息,构建用户关系拓扑图;根据边权重和节点的出入度计算节点权重;构建一阶近邻关系模型和二阶近邻关系模型,确定一阶邻居节点和二阶邻居节点,得到用户节点之间的相互关系;构建社交对齐神经网络,通过社交对齐神经网络对用户关系拓扑图中各节点进行邻居节点的信息聚合、拼接与非线性变换,得到跨社交网络的社交用户身份对齐结果。本发明主要用于通过跨社交网络对其社交用户实现用户关系挖掘。
-
公开(公告)号:CN114943073A
公开(公告)日:2022-08-26
申请号:CN202210380497.9
申请日:2022-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京赋乐科技有限公司
Abstract: 本公开的实施例提供了加密流量的通用对称加密协议脱壳方法、装置、设备和计算机可读存储介质。所述方法包括获取加密协议的流量;基于预设的密码字典,通过马尔科夫‑GEP模型生成新的密码字典;基于加密协议密码字符组合规律,对所述新的密码字典中的密码进行规约;基于规约后的新的密码字典和传统的解密脱壳方法,构建对称加密协议脱壳模型;将所述加密协议的流量,输入至所述对称加密协议脱壳模型,完成脱壳。提高了脱壳准确度,使得脱壳更加高效。
-
公开(公告)号:CN114817661A
公开(公告)日:2022-07-29
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06K9/62
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN114817516A
公开(公告)日:2022-07-29
申请号:CN202210448769.4
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F16/35 , G06F16/951 , G06F40/242 , G06F40/279 , G06F40/30 , G06N3/08
Abstract: 本发明涉及一种零样本条件下基于逆向匹配的画像映射方法,包括在数据特征标签和画像标签两个不同体系间建构双相关文本语料库,使用逆向匹配对语料库进行筛选修正;通过人工标注构建分类语料库,并训练模型建立画像体系间的映射关系;采用基于持续响应衰减的更新机制,并结合标签历史状态对时序变化的画像相关更新数据进行修正。本方法从扩展数据的角度出发,采用基于逆向匹配的文本库构建方法,引入与原始标签相关的外部文本数据扩展并增强标签的语义表达,再引入与用户画像相关的外部数据进行标注建立扩展标签和标注数据之间的联系,从而挖掘出原始特征标签隐含的丰富含义,达到从少量标签序列中计算目标画像的目的。
-
-
-
-
-
-
-
-
-