一种界标窗口下域名数据重复检测快速索引方法

    公开(公告)号:CN104794158A

    公开(公告)日:2015-07-22

    申请号:CN201510117236.8

    申请日:2015-03-17

    Abstract: 本发明涉及一种界标窗口下域名数据重复检测快速索引方法。该方法将界标窗口根据子界标分成多个子窗口,通过稳定性布隆过滤器和字典树维护各子窗口的数据项;针对网络数据流自适应地调整索引策略,在数据较为密集时采用稳定性布隆过滤器,在数据相对稀疏时采用字典树索引策略。在域名数据重复检测的适配方面,本发明提出将域名数据翻转,形成重叠前缀字符串比率较高的数据集,有利于后续字典树的快速匹配和存储容量缩减。本发明能够降低索引维护的空间,提升元素重复检测的效率,并能够扩展到分布式场景下,有效解决网络监控应用中域名数据重复检测的问题,同时,本发明可以扩展到分布式计算场景下,便于计算性能线性提升。

    一种网站分类方法
    85.
    发明公开

    公开(公告)号:CN103605794A

    公开(公告)日:2014-02-26

    申请号:CN201310651985.X

    申请日:2013-12-05

    CPC classification number: G06F17/3089 G06N3/08

    Abstract: 本发明公开了一种网站分类方法,包括:获取网站的多维属性,利用集合对多维属性进行表示;针对表示多维属性的集合,进行自编码特征学习;利用自编码学习结果,进行网站聚类学习,得到用于进行网站分类的支持向量机SVM;步骤S104,对任意一个未经标注的网站进行分类时,先进行步骤S101和步骤S102,得到与该网站对应的自编码学习结果;然后将该结构输入到步骤S103得到的SVM中,进行网站分类,得到网站的类别。本发明的网站分类方法能高效准确的按照行业类别对网站进行分类,并且能快速侦测具有恶意特征的钓鱼网页;采用多维属性描述的方式,增加系统的便利性与通用性;且系统具有极强的稳定性。

    一种隧道报文的处理方法和装置

    公开(公告)号:CN114697408B

    公开(公告)日:2023-09-26

    申请号:CN202011581609.4

    申请日:2020-12-28

    Abstract: 本申请公开了一种隧道报文的处理方法和装置,所述方法包括:当接收到待处理隧道报文时,解析出其隧道头特征;将所述待处理隧道报文的隧道头特征,与已存储的报文处理策略表进行匹配;若命中,根据所命中的报文处理策略处理所述待处理隧道报文;若未命中,解析出所述待处理隧道报文的原始报头特征;将所述待处理隧道报文的原始报头特征,与所述报文处理策略表进行匹配;若命中,根据所命中的报文处理策略处理所述待处理隧道报文。本申请方案,对接收到的待处理隧道报文进行双重匹配,提高了隧道报文处理的准确性。

Patent Agency Ranking