-
公开(公告)号:CN103957154B
公开(公告)日:2017-12-05
申请号:CN201410145480.0
申请日:2014-04-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种网络数据包URL过滤方法,包括步骤一、在Tilera众核平台下配置Mpipe规则;步骤二、创建n个收包线程,为各个线程绑定一个用于处理数据包的CPU核,n个收包线程并行运行;步骤三、在每个收包线程中,调用Mpipe接口接收网络数据包,从网络数据包里提取URL;步骤四、在每个收包线程中,将提取的URL与URL匹配规则表进行快速匹配查找;步骤五、如果在URL匹配规则表中查找到与数据包中的URL时,则数据包匹配URL规则,然后根据程序的参数设置对匹配URL规则的网络数据包进行过滤或者转发,否则按照预先设置的默认方式处理数据包。
-
公开(公告)号:CN105183858A
公开(公告)日:2015-12-23
申请号:CN201510572334.0
申请日:2015-09-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30303 , G06F17/30386
Abstract: 本发明公开一种基于消息队列的分布式数据实时去重方法,根据消息网络接口,配置若干台数据从服务器,并加入消息网络;为每一种需去重的数据配置添加原始数据信息、去重数据信息、去重服务信息;根据原始数据信息,去重数据信息及去重服务信息确定从服务器;原始数据产生者查询重服务信息,并将原始数据发送至相应的原始数据队列;数据从去重服务器查询去重服务信息,从相应的原始数据队列中消费数据,并输入至数据去重引擎,之后将去重后的数据输入到相应的去重数据队列;去重数据消费者查询去重服务信息,并从相应的去重数据队列中消费数据;主服务器根据从服务器信息更新从服务器信息。
-
公开(公告)号:CN104077315A
公开(公告)日:2014-10-01
申请号:CN201310106281.4
申请日:2013-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明公开了一种分布式文件系统数据导入方法及装置。该方法包括:将数据内容存储在源文件系统和目标文件系统都能够访问的存储节点或者存储介质上;根据目标文件系统的存储格式,确定数据组织方式;根据源文件系统的元数据组织结构和/或用户要求,构建目标文件系统中元数据的元数据组织结构和索引节点;根据数据组织方式调整目标文件系统中元数据的存储信息,使元数据的存储信息正确的指向保存在存储节点或者存储介质上的数据内容;根据目标文件系统中的元数据从存储节点或者存储介质上读取相应的数据内容。
-
公开(公告)号:CN102594616A
公开(公告)日:2012-07-18
申请号:CN201110376758.1
申请日:2011-11-23
Applicant: 国家计算机网络与信息安全管理中心 , 华为技术有限公司
Abstract: 本发明公开了一种网络安全检测方法及装置,涉及通信领域,用于解决现有技术中对网络传输的数据流量进行网络安全检测时,业务处理板对数据流量进行处理时过程较为繁琐,且成本较高的问题。本发明实施例提供的方法包括:在所述业务处理板上设置虚拟端口以获取数据流量,其中,所述业务处理板用于检测所述数据流量的安全性;获取数据流量,对所述数据流量进行环回处理,以使得所述业务处理板对所述数据流量进行网络安全检测。本发明适用于通信领域,用于对网络传输的数据流量进行网络安全检测。
-
公开(公告)号:CN109741731B
公开(公告)日:2020-12-29
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN105868300B
公开(公告)日:2019-05-07
申请号:CN201610173374.2
申请日:2016-03-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/903 , G06F9/50
Abstract: 本发明提供一种众核环境下的字符串匹配方法,将待匹配的文本串进行切割为若干文本块后,根据模式集中的模式串长度通过处理器不同的核进行匹配。利用不同的处理器核心处理不同的文本串,再将处理的结果进行统计整合。能够适应处理文本是离散不连续的情况,避免由于有模式串出现了划分而导致的漏匹配。并且能够降低字符串匹配的时间开销。
-
公开(公告)号:CN108897749A
公开(公告)日:2018-11-27
申请号:CN201810355382.8
申请日:2018-04-19
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于语法树和文本块密度的网页信息抽取方法,包括:获取网页的标题文本信息;设定筛选阈值,计算该网页所有节点的文本块密度,以该文本块密度大于该筛选阈值的节点为采集节点,提取该采集节点的节点文本信息;若该采集节点的数量为1,则以该节点文本信息为目标信息进行抽取;若该采集节点的数量大于1,则将该标题文本信息和该节点文本信息分别转换为唯一表达句子语义的标题深层语法树和节点深层语法树;获得每个该节点深层语法树与该标题深层语法树的整体相似度,以该整体相似度中的最大值对应的节点文本信息为目标信息进行抽取。
-
公开(公告)号:CN108769115A
公开(公告)日:2018-11-06
申请号:CN201810354384.5
申请日:2018-04-19
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/08
CPC classification number: H04L67/1008
Abstract: 本发明涉及一种分布式RSS数据采集系统,包括:分布于网络的至少一个采集节点模块,用于采集该网络上的RSS数据;注册中心,用于保存所有该采集节点模块的信息,并将该信息提供给该调度模块;调度模块,用于根据该信息将采集任务分配给该采集节点模块。分布式RSS数据采集方法包括:通过注册中心收集分布于网络的采集节点模块的信息;通过调度模块拉取采集任务;通过该调度模块拉取该信息;根据该信息将该采集任务分配给该采集节点模块;采集该网络上的RSS数据。
-
公开(公告)号:CN108737291A
公开(公告)日:2018-11-02
申请号:CN201810438595.7
申请日:2018-05-09
Applicant: 北京建筑大学 , 国家计算机网络与信息安全管理中心
IPC: H04L12/859 , H04L12/851 , G06F17/27
Abstract: 本发明提供一种网络流量表示的方法及装置,方法包括:采用预设谓词及其论元,按预定事件语义学方法表示网络流量的语义,并根据网络流量的语义,定义网络流量与其它网络流量之间的关系,再根据上述关系,按照预定特征生成网络流量的集合,最后根据网络流量的集合,确定网络流量对应的通信主体的运行情况。该方法通过定义网络流量产生有关的谓词和论元,并采用预定的语义学方法对网络流量进行语义表示,根据网络流量的语义及语义关系形成网络流量的集合来表示通信主体的运行情况,该方法可以对网络流量进行准确的表示,并且表示形式较为简单,解决了现有技术的问题。
-
公开(公告)号:CN108512902A
公开(公告)日:2018-09-07
申请号:CN201810159206.7
申请日:2018-02-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L29/08
Abstract: 本发明公开了一种数据共享方法和装置。该方法包括:获取数据源对应的第一元数据和数据目的对应的第二元数据;根据所述第一元数据和所述第二元数据,配置整形流程文件;根据所述第一元数据、所述第二元数据、所述整形流程文件以及预先配置的数据传输路径,生成共享场景配置文件;根据所述共享场景配置文件传输数据,实现所述数据源和所述数据目之间的数据共享。本发明通过简单配置便可构建数据共享的快速传输通道,在传输通道中,可根据元数据定义及整形流程进行自动整形,数据规范化,可以对多源数据灵活整形,使数据共享过程规范化,并且有效提高了数据共享方案的通用性和传输效率。
-
-
-
-
-
-
-
-
-