一种基于语言模型的应用协议识别方法及系统

    公开(公告)号:CN105390132B

    公开(公告)日:2019-03-22

    申请号:CN201510653901.5

    申请日:2015-10-10

    Abstract: 本发明涉及一种基于语言模型的应用协议识别方法及系统。该方法包括离线阶段和在线阶段;离线阶段包括:将混杂的原始网络数据报文划分为目标应用协议的数据报文集合和非目标应用协议的数据报文集合;构建目标应用协议的语言模型;提取已经标记类别的网络数据报文的协议关键字,作为网络数据报文的分类特征;对离线数据进行学习训练,获得目标应用协议的检测模型;在线阶段包括:根据离线阶段得到的语言模型提取待测网络数据报文的协议关键字作为其分类特征;对待测网络数据报文的协议类别属性进行判别,并输出判别结果。本发明能够充分挖掘网络消息报文中潜在的协议语义信息,在在线网络协议流量分类过程中具有高准确率和强鲁棒性。

    一种基于三分类器协同训练学习的网络协议识别方法及系统

    公开(公告)号:CN104270392B

    公开(公告)日:2017-09-26

    申请号:CN201410575510.1

    申请日:2014-10-24

    Abstract: 本发明涉及一种基于三分类器协同训练学习的网络协议识别方法及系统:对网络原始流量进行IP重组和TCP流还原,将网络数据由包为单位规约为以流为单位;提取每条单向流的特征信息并向量化,构建特征矩阵;使用少量标记样本构建三分类器协同训练分类器;判定是否已有所分析协议的分类模型,如果没有则先利用三分类器协同训练学习方法构建协议分类器,否则对数据包的协议属性进行判别;利用基于J48的三分类器协同训练学习算法进行训练并得到所分析协议的分类模型;对未标识的网络数据包进行协议类别判定,输出结果为两类:一类是属于目标协议的网络数据包,另一类是非目标协议的网络数据包。本发明保证很高的识别准确率和召回率。

    社交僵尸网络控制节点的检测方法及装置

    公开(公告)号:CN103944901B

    公开(公告)日:2016-11-09

    申请号:CN201410158412.8

    申请日:2014-04-18

    Abstract: 本发明涉及一种社交僵尸网络控制节点的检测方法及装置。社交僵尸网络控制节点的检测方法包括:采集合法昵称样本和恶意昵称样本并保存并进行随机划分;基于改进的Aprior算法,从第一合法昵称样本子集中挖掘出所有出现频数超过设定频数阈值的各阶子字符串保存在频繁表中;基于频繁表,利用第二合法昵称样本子集和第一恶意昵称样本子集,根据预设的可信度计算函数和阈值生成规则获得可信度阈值;根据可信度计算函数,利用第三合法昵称样本子集和第二恶意昵称样本子集,验证可信度阈值是否有效;若有效,则根据可信度计算函数和可信度阈值对待检测昵称进行检测。本发明能够在无需对僵尸程序进行逆向的情况下,快速准确地检测出NGA生成的伪随机昵称。

    一种数据布局优化方法及系统

    公开(公告)号:CN103678158B

    公开(公告)日:2016-11-02

    申请号:CN201310732673.1

    申请日:2013-12-26

    Abstract: 本发明涉及一种数据布局优化方法,具体包括以下步骤:步骤1:接收业务系统输入的连续数据流;步骤2:将数据流划分为连续无交叉的多个数据块;步骤3:判断待处理的数据块是否达到缓存上限,如果是,进行下一步;否则,跳转至步骤1;步骤4:计算得到缓存中的所有数据块的指纹;步骤5:将缓存中数据块的指纹与指纹列表中的指纹进行匹配,将匹配的数据块标记为重复数据块;将不指纹匹配的指纹存入指纹列表中;步骤6:更新数据块信息表中的数据块的物理位置信息;步骤7:根据数据块信息表中的各个数据块的物理位置信息存储对应的数据块。本发明提高了数据的顺序性,降低了数据布局的离散化,提高了重复数据删除系统的顺序读写性能。

    集群内存自适应管理方法、服务器集群系统

    公开(公告)号:CN103226520B

    公开(公告)日:2016-09-07

    申请号:CN201310113105.3

    申请日:2013-04-02

    Abstract: 本发明涉及一种集群内存自适应管理方法、服务器集群。其中,集群内存自适应管理方法包括:对于数据服务器集群中的每个数据服务器,在使用前对该数据服务器按照变步长加性增长方式进行内存预分配,将内存分割为设定数目的片组,每个片组的总容量相等,每个片组包含容量相等的多个分片。本发明的集群内存自适应调管理方法,采用优化模式的内存预先分配的策略,保证了内存的合理分片,从而提高了内存的存取效率,也减少了内存碎片的产生。此外,本发明的集群内存自适应调管理方法能够进行内存自适应调整,大大提高了内存的自治能力和稳定性。

    一种基于n-gram多特征的流量载荷类型检测方法

    公开(公告)号:CN105871619A

    公开(公告)日:2016-08-17

    申请号:CN201610240406.6

    申请日:2016-04-18

    CPC classification number: H04L41/14 H04L43/08 H04L43/16 H04L47/2441

    Abstract: 本发明公开了一种基于n?gram多特征的流量载荷类型检测方法。本方法为:1)读取样本网络流的数据包,根据该数据包的按五元组标记其所属的样本网络流;然后计算该样本网络流五元组的哈希值作为键,如果哈希表中不存在该项,则将该哈希值作为新的键并分配一结构体作为键值Value,插入哈希表中;如果存在该键,则在哈希表中获得对应的结构体,将该数据包的载荷数据保存到该结构体中;2)对每一结构体中的载荷数据进行n?gram子串分割,生成该样本网络流的特征向量;3)根据特征向量训练得到一分类模型;4)对于待分类的网络流,生成该网络流的特征向量,然后利用该分类模型判断该网络流的类型。本发明大大提高了检测效率。

    一种P2P网络的构建方法及系统

    公开(公告)号:CN105791408A

    公开(公告)日:2016-07-20

    申请号:CN201610184905.8

    申请日:2016-03-29

    CPC classification number: H04L67/1042

    Abstract: 本发明公开了一种P2P网络的构建方法及系统。该方法包括:对所有的网络节点进行编号;构建一条经过所有网络节点的回路,且回路中相连的两个网络节点位于不同的域;遍历所有的网络节点,并随机选择目标网络节点:若当前遍历的网络节点与目标网络节点位于不同的域,则在当前网络节点与目标网络节点之间添加一条有向边。通过本发明构建的P2P网络具有较强的连通性、跨区域特性以及鲁棒性。

    一种基于语言模型的应用协议识别方法及系统

    公开(公告)号:CN105390132A

    公开(公告)日:2016-03-09

    申请号:CN201510653901.5

    申请日:2015-10-10

    Abstract: 本发明涉及一种基于语言模型的应用协议识别方法及系统。该方法包括离线阶段和在线阶段;离线阶段包括:将混杂的原始网络数据报文划分为目标应用协议的数据报文集合和非目标应用协议的数据报文集合;构建目标应用协议的语言模型;提取已经标记类别的网络数据报文的协议关键字,作为网络数据报文的分类特征;对离线数据进行学习训练,获得目标应用协议的检测模型;在线阶段包括:根据离线阶段得到的语言模型提取待测网络数据报文的协议关键字作为其分类特征;对待测网络数据报文的协议类别属性进行判别,并输出判别结果。本发明能够充分挖掘网络消息报文中潜在的协议语义信息,在线网络协议流量分类过程中具有高准确率和强鲁棒性。

    数据处理方法及装置
    30.
    发明授权

    公开(公告)号:CN103218176B

    公开(公告)日:2016-02-24

    申请号:CN201310113197.5

    申请日:2013-04-02

    Abstract: 本发明涉及一种数据处理方法及装置。其中,数据处理方法包括:创建共享内存环,所述共享内存环为存储待操作数据的环形结构空间;在对共享内存环中下一个操作目的单元进行操作前,将所述下一个操作目的单元的操作标志位设置为对应下一个操作的操作类型;判断所述下一个操作目的单元是否能够进行所述下一个操作;根据判断结果对所述下一个操作目的单元中的数据进行处理。本发明的数据处理方法及装置,设计了一种共享内存中的环形数据结构,结合生产者和消费者的数据协调规则和共享内存环覆写机制,基于原子位操作对环的控制标识位进行更新,提高了数据并行处理场景下共享资源的数据读写效率,减小数据同步的开销,从而解决了共享资源读写效率低、同步开销大的问题。

Patent Agency Ranking