一种基于局部-全局特征注意力的加密应用流量分类方法及系统

    公开(公告)号:CN116827873A

    公开(公告)日:2023-09-29

    申请号:CN202310199298.2

    申请日:2023-03-03

    Abstract: 本发明公开了一种基于局部‑全局特征注意力的加密应用流量分类方法及系统,该方法分为人工智能模型训练阶段和加密应用流量分类阶段。在人工智能模型训练阶段,将根据有应用类别标签的加密应用字节流序列,训练神经网络中的可学习参数,从而实现自动化的加密应用流量特征提取和加密应用流量分类,并得到训练好的加密流量分类模型。加密应用流量分类阶段,基于训练完成的加密应用流量模型参数,对网络环境中获取到的真实网络流量进行特征提取并完成加密应用流量分类。本发明通过局部‑全局特征注意力机制的加密应用流量建模方法,建立更加鲁棒的分类特征,实现对应用流量更加精准的分类。

    一种界标窗口下域名数据重复检测快速索引方法

    公开(公告)号:CN104794158A

    公开(公告)日:2015-07-22

    申请号:CN201510117236.8

    申请日:2015-03-17

    Abstract: 本发明涉及一种界标窗口下域名数据重复检测快速索引方法。该方法将界标窗口根据子界标分成多个子窗口,通过稳定性布隆过滤器和字典树维护各子窗口的数据项;针对网络数据流自适应地调整索引策略,在数据较为密集时采用稳定性布隆过滤器,在数据相对稀疏时采用字典树索引策略。在域名数据重复检测的适配方面,本发明提出将域名数据翻转,形成重叠前缀字符串比率较高的数据集,有利于后续字典树的快速匹配和存储容量缩减。本发明能够降低索引维护的空间,提升元素重复检测的效率,并能够扩展到分布式场景下,有效解决网络监控应用中域名数据重复检测的问题,同时,本发明可以扩展到分布式计算场景下,便于计算性能线性提升。

    一种基于URL特征的网站首页识别方法及电子装置

    公开(公告)号:CN114201698A

    公开(公告)日:2022-03-18

    申请号:CN202010981078.1

    申请日:2020-09-17

    Abstract: 本发明提供一种基于URL特征的网站首页识别方法及电子装置,包括剔除待识别URL首部的http://字符或者https://字符,获取包含http://字符或https://字符的临时变量t1;按照“/”字符对临时变量t1进行拆分,并进行有效性判断;若不能拆分或仅能拆成两部分且第二部分为空,则判断临时变量t1是否包含是二级、三级或四级域名;若仅能拆成两部分、第二部分不为空且第二部分长度小于第一阈值,则判断第二部分是否包含特定字符;若临时变量t1包含是二级、三级或四级域名或第二部分包含特定字符,则判断待识别URL为首页URL。本发明无需训练分类器、人工标注大量数据集及对URL页面内容进行分析,解决了通过语义无法识别嵌套URL的情况,降低了误报率,节省人力与网络资源,提升了识别速度。

Patent Agency Ranking