-
公开(公告)号:CN118709688A
公开(公告)日:2024-09-27
申请号:CN202410746400.0
申请日:2024-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/295 , G06F40/242 , G06N5/04 , G06N3/0455 , G06N3/0499 , G06N3/082
Abstract: 本发明公开一种基于问答机制的文本变体词识别方法、装置及设备,属于文本信息识别领域。所述方法包括:构建变体词库,并通过汉字的字形和拼音的分别编码对所述变体词库进行数据增强;在数据增强后的变体词库上训练一变体词推理模型,所述变体词推理模型的网络结构包括:一语言表征模型和两个独立的全连接层;将问答模板与文本内容相连接后输入所述变体词推理模型,得到文本内容中变体词的起始位置概率和结束位置概率;基于变体词的起始位置概率和结束位置概率确定变体词的确切边界,得到文本内容中变体词的识别结果。本发明不仅能够提高变体词识别的准确性,还能够有效地降低模型的维护成本,增强其在实际应用中的适应性和鲁棒性。
-
公开(公告)号:CN118708728A
公开(公告)日:2024-09-27
申请号:CN202410746389.8
申请日:2024-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/36 , G06F16/33 , G06N5/04 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于难度序列推理的篇章级事件论元抽取方法及系统,属于文本信息抽取领域。本发明根据文档上下文选择对应的提示学习模板,对上下文和提示学习模板进行编码,得到上下文表示和提示表示,该提示表示包含论元角色的向量表示;根据每个论元角色的向量表示计算每个论元角色的预测困难分数,根据预测困难份数对论元角色进行排序,得到预测的推理路径;按照预测的推理路径的顺序进行信息推理,得到每个论元角色的推理概率分布;根据得到的每个论元角色的推理概率分布,预测每个论元角色的位置并抽取论元。本发明能够利用简单论元的信息来帮助抽取困难的论元。
-
公开(公告)号:CN116383716A
公开(公告)日:2023-07-04
申请号:CN202310269511.2
申请日:2023-03-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F18/241 , G06F18/213 , H04L9/40 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种增加自注意力机制和加性角度最大化间隔层的加密流量网络行为识别方法和系统。该方法包括:对加密应用网络行为产生的流量进行预处理和嵌入表示;利用自注意力机制增强流量的嵌入表示的语义;构建加密应用行为流量识别模型,基于自注意力机制得到的结果,利用该模型提取流量的深度特征;在加密应用行为流量识别模型中设置加性角度最大化间隔层,用以最大化不同类别流量特征之间的间隔,增加不同类别向量之间的区分性;通过加密应用行为流量识别模型进行加密流量网络行为的识别。本发明能够解决现有技术在识别加密流量网络行为时未能有效表示流量特征并最大化不同网络行为产生流量特征向量之间的距离,从而导致误分率高的问题。
-
公开(公告)号:CN107239704A
公开(公告)日:2017-10-10
申请号:CN201710374994.7
申请日:2017-05-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F21/56
CPC classification number: G06F21/562
Abstract: 本发明公开了一种恶意网页发现方法及装置,所述方法包括:确定每个预先选取的低可信度用户的网页资源访问集合;从确定的访问集合中确定出所有低可信度用户的网页资源访问交集;对所述访问交集中网页资源进行恶意网页检测,根据检测结果,确定恶意网页。本发明有效地解决现有恶意网页分类技术易漏判、准确率低和效率低的问题。
-
公开(公告)号:CN108628703B
公开(公告)日:2022-06-17
申请号:CN201810225421.2
申请日:2018-03-19
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种基于视觉相似性镜像网站发现方法及系统,该方法的步骤包括:对网页页面进行初步分块,将得到的块作为DOM树的结点;对可分割的结点继续分割,将分出的新块作为该结点的孩子结点;对于不可分割的结点,将该结点的块作为页面块存入页面块池中,如此循环迭代分块,直至得到全部的页面块;检测出页面中的分隔条,确定分割条的权重;基于分割条的权重进行重建,得到语义块;将语义块转换成图像,提取图像的签名特征;根据上述步骤提取目标网页和基准网页的各语义块的签名特征,基于签名特征通过EMD距离算法计算目标网页和基准网页之间的距离,如果该距离小于一设定阈值,则判定该目标网页的网站属于镜像网站。
-
公开(公告)号:CN108768921B
公开(公告)日:2021-03-09
申请号:CN201810264535.8
申请日:2018-03-28
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种基于特征检测的恶意网页发现方法,包括以下步骤:通过读取URL文件,提取URL相关网络行为特征;通过读取DNS文件,提取域名相关网络行为特征;通过读取NetFlow文件,提取流量相关网络行为特征;针对URL相关网络行为特征,域名相关网络行为特征及流量相关网络行为特征进行规则匹配,根据匹配结果识别恶意URL。同时,基于实时捕获的网络流,构建了实现上述方法的在线的具有检测及识别功能的系统,并通过该系统实施在线网页识别,能从实时网络流中实时识别恶意网页的URL。
-
公开(公告)号:CN108768921A
公开(公告)日:2018-11-06
申请号:CN201810264535.8
申请日:2018-03-28
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种基于特征检测的恶意网页发现方法,包括以下步骤:通过读取URL文件,提取URL相关网络行为特征;通过读取DNS文件,提取域名相关网络行为特征;通过读取NetFlow文件,提取流量相关网络行为特征;针对URL相关网络行为特征,域名相关网络行为特征及流量相关网络行为特征进行规则匹配,根据匹配结果识别恶意URL。同时,基于实时捕获的网络流,构建了实现上述方法的在线的具有检测及识别功能的系统,并通过该系统实施在线网页识别,能从实时网络流中实时识别恶意网页的URL。
-
公开(公告)号:CN108628703A
公开(公告)日:2018-10-09
申请号:CN201810225421.2
申请日:2018-03-19
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种基于视觉相似性镜像网站发现方法及系统,该方法的步骤包括:对网页页面进行初步分块,将得到的块作为DOM树的结点;对可分割的结点继续分割,将分出的新块作为该结点的孩子结点;对于不可分割的结点,将该结点的块作为页面块存入页面块池中,如此循环迭代分块,直至得到全部的页面块;检测出页面中的分隔条,确定分割条的权重;基于分割条的权重进行重建,得到语义块;将语义块转换成图像,提取图像的签名特征;根据上述步骤提取目标网页和基准网页的各语义块的签名特征,基于签名特征通过EMD距离算法计算目标网页和基准网页之间的距离,如果该距离小于一设定阈值,则判定该目标网页的网站属于镜像网站。
-
公开(公告)号:CN117574412B
公开(公告)日:2024-04-02
申请号:CN202410060420.2
申请日:2024-01-16
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心
Inventor: 贾云刚 , 王建礼 , 刘铭 , 许光全 , 李鹏霄 , 崔婧怡 , 刘健 , 段东圣 , 井雅琪 , 赵曦滨 , 赵志云 , 赵淳璐 , 贺欣 , 马宏远 , 张震 , 高一骄 , 武南南 , 孙捷 , 孙海亮 , 刘秀龙
Abstract: 本申请实施例提供一种多方隐私求交方法、装置和电子设备,涉及数据处理技术领域,应用于目标参与方,多个参与方包括目标参与方和其他参与方,该方法包括:依次接收其他参与方发送的多个隐私信息,各隐私信息包括其他参与方的签名信息和第一哈希表数据片段;基于多个隐私信息中的签名信息,对其他参与方的身份进行验证;在其他参与方的身份验证通过的情况下,基于多个第一哈希表数据片段和目标参与方的哈希表数据,确定其他参与方和目标参与方之间的隐私求交结果。这样在计算多个参与方的隐私求交结果时,可以有效地实现隐私求交结果的计算效率和参与方之间的通信效率的平衡。
-
公开(公告)号:CN117632041A
公开(公告)日:2024-03-01
申请号:CN202410102237.4
申请日:2024-01-25
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心 , 南开大学
Inventor: 贾云刚 , 刘健 , 刘铭 , 许光全 , 闫莉莉 , 李鹏霄 , 光炫 , 贺欣 , 朱佳伟 , 李晓华 , 赵志云 , 井雅琪 , 吕东 , 马宏远 , 张震 , 段东圣 , 高一骄 , 刘秀龙 , 孙捷 , 孙海亮
IPC: G06F3/06 , G06F11/10 , H04L67/1097
Abstract: 本发明提供一种基于再生码的分布式存储方法、装置和电子设备,属于分布式存储技术领域。该方法包括:获取待存储的原始数据,确定原始数据对应的原始数据向量;确定分布式存储系统中各系统节点的编码矩阵以及分布式存储系统中各校验节点的编码矩阵;基于各系统节点的编码矩阵和原始数据向量分别确定各系统节点存储的第一再生码数据向量;基于各校验节点的编码矩阵和原始数据向量分别确定各校验节点存储的第二再生码数据向量。将第一再生码数据向量发送至对应的系统节点进行存储,将第二再生码数据向量发送至对应的校验节点进行存储。本方案通过以向量为单位进行存储,通信过程中是对每个单位向量整体进行编解码,节约了计算资源。
-
-
-
-
-
-
-
-
-