基于负载映射与随机森林的非加密流量识别方法

    公开(公告)号:CN108737290A

    公开(公告)日:2018-11-02

    申请号:CN201810449191.8

    申请日:2018-05-11

    Abstract: 本发明针对于非加密流量提出了一种移动应用流量识别方法。方法结合向量空间映射与随机森林分类器,包括预处理阶段,用于将流量负载进行预处理;随机森林分类器建模阶段,将流量负载映射到向量空间,利用流量训练集合建立随机森林模型;分类阶段,待识别流量通过随机森林模型分类。常见的非加密流量识别方法,局限于寻找固定长度或可变长度的特征字符串,为此花费了巨大的精力。本发明引入自然语言处理领域的方法。将非加密负载转化为向量,克服了寻找特征字符时间复杂度大的特点。本发明可以用于非加密流量的应用类型识别,具有较高的识别准确度。

    基于K_means和KNN融合算法的网络流量分类方法

    公开(公告)号:CN108650194A

    公开(公告)日:2018-10-12

    申请号:CN201810454425.8

    申请日:2018-05-14

    Abstract: 本发明提出了基于K_means和KNN融合算法的网络流量分类方法。该方法的框架是针对每个应用协议构建一个二分类器,由决策规则将所有分类器的输出整合为最终输出。算法上融合了无监督的K_means算法和有监督的KNN算法,此外,该方法还提出了基于K_means迭代的特征选择算法,目的是选出高分离度的特征,以节省时间、空间和提高分类效果。实验结果表明,在真实流量数据上,本发明对流量识别的准确率和召回率可达90%以上,相比现有典型的流量分类方法效果更好;本发明还可识别出未登录流量,与典型的分类方法相比在功能上有了扩展。

    网络音频MP3流乱序分段解码方法

    公开(公告)号:CN104202656B

    公开(公告)日:2017-08-04

    申请号:CN201410472027.0

    申请日:2014-09-16

    Abstract: 本发明提供了一种网络音频MP3流乱序分段解码方法,涉及音频流处理技术领域。本方法从网络中捕获音频MP3数据包,获取MP3数据帧并根据位置信息存储在缓存中,一个session建立一个缓存,当有连续MP3数据帧达到指定大小时,进行音频解码。采用FFmpeg技术进行数据块解码,解码时修改相应的上下文,通过伪装的方式让FFmpeg进行解码。采用具有多个加速单元的独立板卡进行解码,加速单元采用FFmpeg技术实现,从而可实现并行解码。无论网络音频MP3以何种顺序接收,本发明方法均能以固定数量的音频帧为单位拼接并进行最大程度解码,并可支持多数据流并发解码,提高了音频流有效帧数的接收率和解码率。

    一种基于规则配置的URL搜索关键词提取的方法及系统

    公开(公告)号:CN105631050A

    公开(公告)日:2016-06-01

    申请号:CN201610111430.X

    申请日:2016-03-01

    Abstract: 本发明公开了一种基于规则配置的URL搜索关键词提取的方法,包括生成规则:对需要支持的搜索引擎的搜索URL进行分析,提取搜索URL特征并生成规则;配置规则:配置上述步骤分析到的规则;URL过滤:接收第三方的URL数据并与配置的所述规则进行匹配来过滤收到的所有URL数据;关键词处理:当有第三方的URL命中所述规则,则提取该URL的搜索关键词。本发明可以通过配置规则来快速的实现对多种搜索引擎的搜索URL关键字进行提取,实现海量URL数据的快速处理,从而在信安系统或舆情系统中使用本发明可以提供强有力的支撑。

    PCI-E多缓冲区DMA数据传输方法

    公开(公告)号:CN104239248A

    公开(公告)日:2014-12-24

    申请号:CN201410472222.3

    申请日:2014-09-16

    Abstract: 本发明提供了一种PCI-E多缓冲区DMA数据传输方法,涉及PCI-E数据传输技术领域。本方法在数据源系统和数据目的系统中各自分配N块物理内存,分别对两个系统中的N块物理内存通过双向链表建立空闲内存池及工作内存池;从空闲内存池获取用于写入数据的内存,写入数据的内存加入工作内存池;在环形缓冲区中写入所要操作的内存的物理起始地址和大小。本发明通过空闲内存池及工作内存池的使用减少内存拷贝次数和系统调用次数;通过环形缓冲区增加DMA的数据传输速率。本发明在大数据量的传输下降低了系统的等待开销,提高了传输效率。

    藏语方言识别方法及系统

    公开(公告)号:CN104036774A

    公开(公告)日:2014-09-10

    申请号:CN201410280868.1

    申请日:2014-06-20

    Abstract: 本发明公开了一种藏语方言识别方法及系统,该方法包括:预先训练语种识别模型,所述语种识别模型包括:多方言DNN并行音素识别器模型、多方言语言模型;接收待识别藏语方言语音信息;提取所述语音信息的声学特征;利用所述多方言DNN并行音素识别器模型获得对应所述声学特征的音素序列;计算各音素序列在每个语言模型上的似然得分;将似然得分最高的语言模型对应的方言作为所述语音信息对应的方言种类。利用本发明,可以提高藏语方言识别效果。

Patent Agency Ranking