Patent search ap:("中国科学院自动化研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"汪立东" Page 4

31.

发明公开
短文本相似度计算方法及系统无效

公开(公告)号：CN108334495A

公开(公告)日：2018-07-27

申请号：CN201810090296.9

申请日：2018-01-30

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 王慧 , 汪立东 , 王博 , 刘春阳 , 张旭 , 王萌 , 李雄

IPC: G06F17/27 , G06K9/62

Abstract: 本发明提供了一种短文本相似度计算方法，包括以下步骤：S1、对训练语料进行分词，利用word2vec算法得到每个词的词向量，并组合形成词向量集合；S2、分别对待计算短文本进行分词，在词向量集合中找到待计算短文本的每个词语的词向量，并组合形成短文本向量集合；S3、计算词向量集合中每个词向量与短文本向量集合中每个词向量的余弦相似度，并得到每个词向量的最大相似度值组合得到短文本句子向量；S4、计算两个短文本句子向量间的相似度，即可计算两个短文本间的相似度。本发明还提供了一种短文本相似度计算系统。本发明的相似度算法通过将短文本句子以句子向量表示，有效的刻画了短文本句子之间的语义相似度，准确率高。

32.

发明授权
一种网络数据包负载均衡和预解析方法有权

公开(公告)号：CN105207946B

公开(公告)日：2018-05-01

申请号：CN201510535316.5

申请日：2015-08-27

Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司

Inventor： 张良 , 云晓春 , 汪立东 , 李晓倩 , 谢铭 , 黄成 , 王子厚 , 孙昊良 , 张露晨 , 何清林 , 吴昊 , 马秀娟 , 张家琦 , 黄文廷

IPC: H04L12/801 , G06F9/50

Abstract: 本发明一种网络数据包负载均衡和预解析方法，属于众核服务器的网络结构领域。包括以下步骤：一、在众核服务器下配置交换芯片；二、数据包经过外接接口进入交换芯片后，平均分给2个MPIPE；三、每个MPIPE将数据包转发到对应的TILERA CPU上，并进行预解析；四、在每个TILERA CPU上调用库函数创建数据包处理线程；五、为每个数据包处理线程分别绑定一个TILERA CPU核；六、将预解析结果分发到对应的数据包处理线程；七、各个处理线程分别通过库函数接收数据包并且得到预解析结果，保存源IP和目的IP。优点在于：使用交换芯片和MPIPE进行各个TILERA CPU之间的负载均衡，对于处理线程不需要再解析数据包，只对关注的数据包域进行处理；操作更加简便，提高数据包的处理能力。

33.

发明公开
网络数据包URL过滤方法失效

公开(公告)号：CN103957154A

公开(公告)日：2014-07-30

申请号：CN201410145480.0

申请日：2014-04-11

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 汪立东 , 谢铭 , 鲁松 , 张良 , 王子厚 , 王维晟 , 黄成

IPC: H04L12/70 , G06F17/30

Abstract: 本发明公开了一种网络数据包URL过滤方法，包括步骤一、在Tilera众核平台下配置Mpipe规则；步骤二、创建n个收包线程，为各个线程绑定一个用于处理数据包的CPU核，n个收包线程并行运行；步骤三、在每个收包线程中，调用Mpipe接口接收网络数据包，从网络数据包里提取URL；步骤四、在每个收包线程中，将提取的URL与URL匹配规则表进行快速匹配查找；步骤五、如果在URL匹配规则表中查找到与数据包中的URL时，则数据包匹配URL规则，然后根据程序的参数设置对匹配URL规则的网络数据包进行过滤或者转发，否则按照预先设置的默认方式处理数据包。

34.

发明公开
一种均衡分两组编译正则表达式的方法无效

公开(公告)号：CN102111405A

公开(公告)日：2011-06-29

申请号：CN201010611550.9

申请日：2010-12-17

Applicant: 国家计算机网络与信息安全管理中心 , 曙光信息产业(北京)有限公司

Inventor： 刘灿 , 云晓春 , 杜跃进 , 汪立东 , 陈训逊 , 包秀国 , 杜翠兰 , 王勇 , 薛晨

IPC: H04L29/06 , G06F9/38

Abstract: 本发明提供了一种均衡分两组编译正则表达式的方法，充分了利用片外资源，使FPGA能够两路进行匹配，采用最大割的方法来进行分组，使n条正则式生成两组状态数较为均匀的DFA，降低其空间复杂度，这样，在不降低实时性的同时，硬件空间不变，尽可能多的增加了硬件处理正则式的数量。

35.

发明公开
一种多路服务器多缓冲区并行收包的性能优化方法有权

公开(公告)号：CN102073547A

公开(公告)日：2011-05-25

申请号：CN201010611827.8

申请日：2010-12-17

Applicant: 国家计算机网络与信息安全管理中心 , 曙光信息产业(北京)有限公司

Inventor： 云晓春 , 杜跃进 , 王丽宏 , 汪立东 , 陈训逊 , 包秀国 , 杜翠兰 , 王勇 , 刘朝辉

IPC: G06F9/50

Abstract: 本发明提供了一种多路服务器多缓冲区并行收包的性能优化方法。驱动软件负责分配接收报文使用的缓冲区，需要在内核中为每一个线程申请一个报文缓冲区，因为在内核中申请，所以申请内存时，可以通过参数指定内存的相连的CPU号为线程编号，也就是说，为线程0申请0号CPU上的本地内存，为线程1申请1号CPU上的本地内存。接口库软件在每个线程第一次调用接收报文的API接口时，把线程绑定到与线程号相对应的CPU上。有效避免了CPU访问远地内存和线程在多个CPU上调度的开销，提高了多线程收包的效率。

36.

发明授权
一种网络实体行为奇异性检测方法及装置失效

公开(公告)号：CN108964998B

公开(公告)日：2021-10-15

申请号：CN201810735317.8

申请日：2018-07-06

Applicant: 北京建筑大学 , 国家计算机网络与信息安全管理中心

Inventor： 钱丽萍 , 汪立东

IPC: H04L12/24 , H04L12/26

Abstract: 本发明公开了一种网络实体行为奇异性检测方法及装置，本发明通过提取训练周期内网络实体访问网络行为的时域、空域和频域特征，为其时域、空域和频域行为画像，并以此画像作为网络实体后续网络行为奇异性检测依据，相对于现有技术来说，本发明采取自主学习而无需专家经验和先验知识，检测准确率较高，计算复杂性较低，且可以同步检测和演进画像以确保检测结果的时效性，可以支持多种基于网络流量检测技术的业务应用。

37.

发明授权
一种基于关键字词频特征的多模式匹配方法失效

公开(公告)号：CN105373601B

公开(公告)日：2019-05-21

申请号：CN201510755911.X

申请日：2015-11-09

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 何睿 , 吴昊 , 汪立东 , 何清林 , 马秀娟 , 张良 , 张露晨 , 李晓倩 , 孙昊良

IPC: G06F16/245 , G06F21/55

Abstract: 本发明提供一种基于关键字词频特征的多模式匹配方法，首先从已知的信息数据库中提取关键字并统计出现频率作为其词频信息，其次采用构造含有关键字词频信息的二叉树完成其中的模式串匹配，在字符匹配过程中若出现字符不相等，则与该不匹配字符所在节点的兄弟节点所含字符进行匹配。其利用信息来源的模式的关键字词频信息构造基于字典树的二叉树完成其中的模式串的匹配，并与AC算法进行了比较。传统的AC算法需要维护三张表，并且在模式匹配过程中会频繁访问这三张表；本发明的一种基于关键字词频特征的多模式匹配方法更多的利用了模式本身的词频信息，并不需要维护过多的信息，这就大大减少了系统的内存消耗。

38.

发明公开
一种语种训练数据获得方法及装置有权

公开(公告)号：CN109741731A

公开(公告)日：2019-05-10

申请号：CN201910015434.1

申请日：2019-01-08

Applicant: 国家计算机网络与信息安全管理中心 , 清华大学

Inventor： 袁庆升 , 汪立东 , 包秀国 , 张鸿 , 时磊 , 张卫强 , 邵云飞

IPC: G10L15/00 , G10L15/06 , G10L15/32

Abstract: 本发明提供一种语种训练数据获得方法及装置，用以解决相关技术中语种训练数据质量较低的问题。该方法包括：训练用于识别各种语种的语种识别模型；使用各语种识别模型识别数据集中的第二音频数据，获得与各语种识别模型对应的得分；确定第二音频数据对应的识别语种；计算数据集中各条第二音频数据的得分信息熵；将所述数据集中，得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集，训练数据集中的第二音频数据用于训练所述语种识别模型，返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤，直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

39.

发明授权
网络数据包URL过滤方法失效

公开(公告)号：CN103957154B

公开(公告)日：2017-12-05

申请号：CN201410145480.0

申请日：2014-04-11

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 汪立东 , 谢铭 , 鲁松 , 张良 , 王子厚 , 王维晟 , 黄成

IPC: H04L12/70 , G06F17/30

Abstract: 本发明公开了一种网络数据包URL过滤方法，包括步骤一、在Tilera众核平台下配置Mpipe规则；步骤二、创建n个收包线程，为各个线程绑定一个用于处理数据包的CPU核，n个收包线程并行运行；步骤三、在每个收包线程中，调用Mpipe接口接收网络数据包，从网络数据包里提取URL；步骤四、在每个收包线程中，将提取的URL与URL匹配规则表进行快速匹配查找；步骤五、如果在URL匹配规则表中查找到与数据包中的URL时，则数据包匹配URL规则，然后根据程序的参数设置对匹配URL规则的网络数据包进行过滤或者转发，否则按照预先设置的默认方式处理数据包。

40.

发明公开
一种基于消息队列的分布式数据实时去重方法失效

公开(公告)号：CN105183858A

公开(公告)日：2015-12-23

申请号：CN201510572334.0

申请日：2015-09-10

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 王大伟 , 孙昊良 , 何清林 , 马秀娟 , 张良 , 吴昊 , 汪立东

IPC: G06F17/30

CPC classification number: G06F17/30303 , G06F17/30386

Abstract: 本发明公开一种基于消息队列的分布式数据实时去重方法，根据消息网络接口，配置若干台数据从服务器，并加入消息网络；为每一种需去重的数据配置添加原始数据信息、去重数据信息、去重服务信息；根据原始数据信息，去重数据信息及去重服务信息确定从服务器；原始数据产生者查询重服务信息，并将原始数据发送至相应的原始数据队列；数据从去重服务器查询去重服务信息，从相应的原始数据队列中消费数据，并输入至数据去重引擎，之后将去重后的数据输入到相应的去重数据队列；去重数据消费者查询去重服务信息，并从相应的去重数据队列中消费数据；主服务器根据从服务器信息更新从服务器信息。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification