一种基于语义敏感的网络协议识别方法及系统

    公开(公告)号:CN104468262A

    公开(公告)日:2015-03-25

    申请号:CN201410652834.0

    申请日:2014-11-17

    Abstract: 本发明涉及一种基于语义敏感的网络协议识别方法及系统。在建模阶段,以特定应用协议的网络数据报文集合作为输入,利用Latent Dirichlet Allocation方法构建所分析协议的关键字模型;在训练阶段,依照协议关键字模型提取数据报文的分类特征信息,以获得的关键字特征向量作为输入,利用有监督机器学习方法对离线训练数据集学习训练,获得所分析协议的分类模型;在分类阶段,依照协议关键字模型提取数据报文的分类特征信息,利用协议分类模型对待测网络数据报文的协议属性做出判别,判断其是否属于目标协议的网络数据报文。本发明能够充分挖掘网络消息报文中潜在的协议语义信息,对多种网络协议进行有效的协议识别。

    一种恶意代码捕获方法及系统

    公开(公告)号:CN102833240B

    公开(公告)日:2016-02-03

    申请号:CN201210294945.X

    申请日:2012-08-17

    Abstract: 本发明涉及一种恶意代码捕获方法及系统。恶意代码捕获方法包括:从多种电子邮件数据源中获取邮件数据;解析所述邮件数据,将所述邮件数据中根据设定的漏报率无法排除的文件记录为可疑文件,并将该可疑文件保存到可疑文件数据库中;利用恶意代码特征数据库和人工检测对所述可疑文件进行检测,将检测结果为异常的可疑文件保存到所述恶意代码样本数据库。本发明的恶意代码捕获方法及系统可以应用于相关的蜜罐与蜜网系统中,能够增加捕获对象的覆盖范围,提升恶意代码的捕获能力。

    一种未知网络协议识别方法及系统

    公开(公告)号:CN103297427B

    公开(公告)日:2016-01-06

    申请号:CN201310189079.2

    申请日:2013-05-21

    Abstract: 本发明涉及一种未知网络协议识别方法,包括:步骤1,以待识别的网络数据包为输入,并将每个网络数据包表征为可用于分类的特征向量;步骤2,以获得的特征向量为输入,形成特征向量数据集,利用面向支持向量机的主动学习方法对该特征向量数据集进行学习,获得针对待测网络协议的分类器;步骤3,利用得到的分类器,对待识别的网络数据包的协议属性做出判别。对应该方法,本发明还给出了一种未知网络协议识别系统,包括数据包建模模块、分类器构建模块和识别模块。本发明采用主动学习方法,可使用较少的已标记样本达到较优的学习效率,从而有效地降低了学习过程中标记的样本数目,能够从混杂的网络流量中准确识别所分析的网络协议。

    基于特征压缩与特征选择的歪斜场景文字识别方法

    公开(公告)号:CN104598881A

    公开(公告)日:2015-05-06

    申请号:CN201510014950.4

    申请日:2015-01-12

    CPC classification number: G06K9/346 G06K9/4604 G06K9/6223 G06K9/6269

    Abstract: 本发明涉及一种基于特征压缩与特征选择的歪斜场景文字识别方法,其步骤包括:在文字区域的每个像素点上提取CHOG特征;根据CHOG特征的差异程度确定字符级的聚类数量;对CHOG特征进行聚类得到压缩后的字符级特征;将压缩过的特征合并,再次进行聚类,生成初始的视觉特征词典;建立视觉特征直方图描述符;训练线性支持向量机,对直方图描述符中特征的重要性进行排序,选出若干最重要的特征作为最终的词典;再次计算样本的直方图描述符,训练多类径向基函数支持向量机,作为最终的文字分类器以对歪斜场景文字进行识别,得到识别结果。本发明能够在克服特征点检测法失效的同时,保证很高的识别准确率和召回率。

    一种基于语义敏感的网络协议识别方法及系统

    公开(公告)号:CN104468262B

    公开(公告)日:2017-12-15

    申请号:CN201410652834.0

    申请日:2014-11-17

    Abstract: 本发明涉及一种基于语义敏感的网络协议识别方法及系统。在建模阶段,以特定应用协议的网络数据报文集合作为输入,利用Latent Dirichlet Allocation方法构建所分析协议的关键字模型;在训练阶段,依照协议关键字模型提取数据报文的分类特征信息,以获得的关键字特征向量作为输入,利用有监督机器学习方法对离线训练数据集学习训练,获得所分析协议的分类模型;在分类阶段,依照协议关键字模型提取数据报文的分类特征信息,利用协议分类模型对待测网络数据报文的协议属性做出判别,判断其是否属于目标协议的网络数据报文。本发明能够充分挖掘网络消息报文中潜在的协议语义信息,对多种网络协议进行有效的协议识别。

    一种基于语言模型的应用协议识别方法及系统

    公开(公告)号:CN105390132B

    公开(公告)日:2019-03-22

    申请号:CN201510653901.5

    申请日:2015-10-10

    Abstract: 本发明涉及一种基于语言模型的应用协议识别方法及系统。该方法包括离线阶段和在线阶段;离线阶段包括:将混杂的原始网络数据报文划分为目标应用协议的数据报文集合和非目标应用协议的数据报文集合;构建目标应用协议的语言模型;提取已经标记类别的网络数据报文的协议关键字,作为网络数据报文的分类特征;对离线数据进行学习训练,获得目标应用协议的检测模型;在线阶段包括:根据离线阶段得到的语言模型提取待测网络数据报文的协议关键字作为其分类特征;对待测网络数据报文的协议类别属性进行判别,并输出判别结果。本发明能够充分挖掘网络消息报文中潜在的协议语义信息,在在线网络协议流量分类过程中具有高准确率和强鲁棒性。

    一种基于三分类器协同训练学习的网络协议识别方法及系统

    公开(公告)号:CN104270392B

    公开(公告)日:2017-09-26

    申请号:CN201410575510.1

    申请日:2014-10-24

    Abstract: 本发明涉及一种基于三分类器协同训练学习的网络协议识别方法及系统:对网络原始流量进行IP重组和TCP流还原,将网络数据由包为单位规约为以流为单位;提取每条单向流的特征信息并向量化,构建特征矩阵;使用少量标记样本构建三分类器协同训练分类器;判定是否已有所分析协议的分类模型,如果没有则先利用三分类器协同训练学习方法构建协议分类器,否则对数据包的协议属性进行判别;利用基于J48的三分类器协同训练学习算法进行训练并得到所分析协议的分类模型;对未标识的网络数据包进行协议类别判定,输出结果为两类:一类是属于目标协议的网络数据包,另一类是非目标协议的网络数据包。本发明保证很高的识别准确率和召回率。

    一种基于语言模型的应用协议识别方法及系统

    公开(公告)号:CN105390132A

    公开(公告)日:2016-03-09

    申请号:CN201510653901.5

    申请日:2015-10-10

    Abstract: 本发明涉及一种基于语言模型的应用协议识别方法及系统。该方法包括离线阶段和在线阶段;离线阶段包括:将混杂的原始网络数据报文划分为目标应用协议的数据报文集合和非目标应用协议的数据报文集合;构建目标应用协议的语言模型;提取已经标记类别的网络数据报文的协议关键字,作为网络数据报文的分类特征;对离线数据进行学习训练,获得目标应用协议的检测模型;在线阶段包括:根据离线阶段得到的语言模型提取待测网络数据报文的协议关键字作为其分类特征;对待测网络数据报文的协议类别属性进行判别,并输出判别结果。本发明能够充分挖掘网络消息报文中潜在的协议语义信息,在线网络协议流量分类过程中具有高准确率和强鲁棒性。

    一种基于三分类器协同训练学习的网络协议识别方法及系统

    公开(公告)号:CN104270392A

    公开(公告)日:2015-01-07

    申请号:CN201410575510.1

    申请日:2014-10-24

    CPC classification number: H04L43/026 H04L43/18 H04L69/22

    Abstract: 本发明涉及一种基于三分类器协同训练学习的网络协议识别方法及系统:对网络原始流量进行IP重组和TCP流还原,将网络数据由包为单位规约为以流为单位;提取每条单向流的特征信息并向量化,构建特征矩阵;使用少量标记样本构建三分类器协同训练分类器;判定是否已有所分析协议的分类模型,如果没有则先利用三分类器协同训练学习方法构建协议分类器,否则对数据包的协议属性进行判别;利用基于J48的三分类器协同训练学习算法进行训练并得到所分析协议的分类模型;对未标识的网络数据包进行协议类别判定,输出结果为两类:一类是属于目标协议的网络数据包,另一类是非目标协议的网络数据包。本发明保证很高的识别准确率和召回率。

    一种恶意代码捕获方法及系统

    公开(公告)号:CN102833240A

    公开(公告)日:2012-12-19

    申请号:CN201210294945.X

    申请日:2012-08-17

    Abstract: 本发明涉及一种恶意代码捕获方法及系统。恶意代码捕获方法包括:从多种电子邮件数据源中获取邮件数据;解析所述邮件数据,将所述邮件数据中根据设定的漏报率无法排除的文件记录为可疑文件,并将该可疑文件保存到可疑文件数据库中;利用恶意代码特征数据库和人工检测对所述可疑文件进行检测,将检测结果为异常的可疑文件保存到所述恶意代码样本数据库。本发明的恶意代码捕获方法及系统可以应用于相关的蜜罐与蜜网系统中,能够增加捕获对象的覆盖范围,提升恶意代码的捕获能力。

Patent Agency Ranking