-
公开(公告)号:CN105701248A
公开(公告)日:2016-06-22
申请号:CN201610122005.0
申请日:2016-03-03
Applicant: 北京建筑大学 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30705 , G06F17/30731
Abstract: 本发明公开了一种量化确定专业领域词汇集量优维度的方法。该方法包括:选择少量专业领域种子词汇,以定制接口搜索互联网搜索引擎和专业文献索引网站获取样本文档,利用专家标注的样本文档,生成正、负文档相关的词汇集合;计算词汇的聚合重要性,以其建立正、负词汇特征集合的权序关系;递增特征维度,按序选择该维度数目的正、负词汇,生成合并特征集合;基于合并特征集合计算正、负词汇特征集合之间的距离、相似度和区分指数;以区分指数的变化率确定区分维度,按序从正词汇特征集中选择该维度数目的词汇,生成最优数目的专业领域词汇特征集;以新选择的专业领域词汇作为种子词,重复上述过程进行迭代自举,直至不再获得新的专业领域词汇。
-
公开(公告)号:CN105207946A
公开(公告)日:2015-12-30
申请号:CN201510535316.5
申请日:2015-08-27
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
IPC: H04L12/801 , G06F9/50
Abstract: 本发明一种网络数据包负载均衡和预解析方法,属于众核服务器的网络结构领域。包括以下步骤:一、在众核服务器下配置交换芯片;二、数据包经过外接接口进入交换芯片后,平均分给2个MPIPE;三、每个MPIPE将数据包转发到对应的TILERA CPU上,并进行预解析;四、在每个TILERA CPU上调用库函数创建数据包处理线程;五、为每个数据包处理线程分别绑定一个TILERA CPU核;六、将预解析结果分发到对应的数据包处理线程;七、各个处理线程分别通过库函数接收数据包并且得到预解析结果,保存源IP和目的IP。优点在于:使用交换芯片和MPIPE进行各个TILERA CPU之间的负载均衡,对于处理线程不需要再解析数据包,只对关注的数据包域进行处理;操作更加简便,提高数据包的处理能力。
-
公开(公告)号:CN102546398A
公开(公告)日:2012-07-04
申请号:CN201110424311.7
申请日:2011-12-16
Applicant: 华为技术有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例公开了一种报文匹配方法,包括:接收到报文后,确定与报文属性信息匹配的访问控制列表ACL规则,以及获取所述ACL规则对应的报文处理策略,所述ACL规则对应的报文处理策略包括:对所述报文进行传输层或应用层匹配;根据所述ACL规则对应的报文处理策略,对所述报文的传输层数据进行传输层规则匹配或对所述报文的应用层数据进行应用层规则匹配。本发明实施例还公开了一种报文匹配装置。采用本发明,可以对报文进行深度识别。
-
公开(公告)号:CN102243656A
公开(公告)日:2011-11-16
申请号:CN201110162453.0
申请日:2011-06-16
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种基于散列的串匹配方法及其选择模式串子窗口的方法。通过选择每个模式串的最优子窗口来计算该模式串的散列值,并以此来建立散列表。从而在大量的模式串有相同的前缀、后缀或子串的情况下,确保模式串尽量均匀地散列到散列表中,提高散列表的均匀性,保证基于散列的串匹配方法的高效运行。
-
公开(公告)号:CN108964998B
公开(公告)日:2021-10-15
申请号:CN201810735317.8
申请日:2018-07-06
Applicant: 北京建筑大学 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种网络实体行为奇异性检测方法及装置,本发明通过提取训练周期内网络实体访问网络行为的时域、空域和频域特征,为其时域、空域和频域行为画像,并以此画像作为网络实体后续网络行为奇异性检测依据,相对于现有技术来说,本发明采取自主学习而无需专家经验和先验知识,检测准确率较高,计算复杂性较低,且可以同步检测和演进画像以确保检测结果的时效性,可以支持多种基于网络流量检测技术的业务应用。
-
公开(公告)号:CN105373601B
公开(公告)日:2019-05-21
申请号:CN201510755911.X
申请日:2015-11-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/245 , G06F21/55
Abstract: 本发明提供一种基于关键字词频特征的多模式匹配方法,首先从已知的信息数据库中提取关键字并统计出现频率作为其词频信息,其次采用构造含有关键字词频信息的二叉树完成其中的模式串匹配,在字符匹配过程中若出现字符不相等,则与该不匹配字符所在节点的兄弟节点所含字符进行匹配。其利用信息来源的模式的关键字词频信息构造基于字典树的二叉树完成其中的模式串的匹配,并与AC算法进行了比较。传统的AC算法需要维护三张表,并且在模式匹配过程中会频繁访问这三张表;本发明的一种基于关键字词频特征的多模式匹配方法更多的利用了模式本身的词频信息,并不需要维护过多的信息,这就大大减少了系统的内存消耗。
-
公开(公告)号:CN109741731A
公开(公告)日:2019-05-10
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN108470046A
公开(公告)日:2018-08-31
申请号:CN201810184478.2
申请日:2018-03-07
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/34 , G06F16/9535
Abstract: 本发明涉及计算机技术领域,具体提供了一种基于新闻事件搜索语句的新闻事件排序方法及系统,旨在解决在考虑用户主观信息的情况下,如何实现新闻事件排序的技术问题。为此目的,本发明中的新闻事件排序方法,能够通过预设的新闻事件排序模型对预先获取的新闻事件搜索语句进行识别,得到按照相关度大小排序的新闻事件排序结果。其中,新闻事件搜索语句包含能够表征用户情感倾向的用户主观信息。基于此,本发明能够结合用户对新闻事件的情感倾向,按照新闻事件与用户偏好相关程度进行排序,从而提高新闻事件排序结果的准确性。同时,本发明中的系统能够执行并实现上述方法。
-
公开(公告)号:CN103957154B
公开(公告)日:2017-12-05
申请号:CN201410145480.0
申请日:2014-04-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种网络数据包URL过滤方法,包括步骤一、在Tilera众核平台下配置Mpipe规则;步骤二、创建n个收包线程,为各个线程绑定一个用于处理数据包的CPU核,n个收包线程并行运行;步骤三、在每个收包线程中,调用Mpipe接口接收网络数据包,从网络数据包里提取URL;步骤四、在每个收包线程中,将提取的URL与URL匹配规则表进行快速匹配查找;步骤五、如果在URL匹配规则表中查找到与数据包中的URL时,则数据包匹配URL规则,然后根据程序的参数设置对匹配URL规则的网络数据包进行过滤或者转发,否则按照预先设置的默认方式处理数据包。
-
公开(公告)号:CN105183858A
公开(公告)日:2015-12-23
申请号:CN201510572334.0
申请日:2015-09-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30303 , G06F17/30386
Abstract: 本发明公开一种基于消息队列的分布式数据实时去重方法,根据消息网络接口,配置若干台数据从服务器,并加入消息网络;为每一种需去重的数据配置添加原始数据信息、去重数据信息、去重服务信息;根据原始数据信息,去重数据信息及去重服务信息确定从服务器;原始数据产生者查询重服务信息,并将原始数据发送至相应的原始数据队列;数据从去重服务器查询去重服务信息,从相应的原始数据队列中消费数据,并输入至数据去重引擎,之后将去重后的数据输入到相应的去重数据队列;去重数据消费者查询去重服务信息,并从相应的去重数据队列中消费数据;主服务器根据从服务器信息更新从服务器信息。
-
-
-
-
-
-
-
-
-