一种基于特征优化的开源代理软件流量识别方法

    公开(公告)号:CN115174198A

    公开(公告)日:2022-10-11

    申请号:CN202210768482.X

    申请日:2022-07-01

    Applicant: 东南大学

    Abstract: 本发明设计一种基于特征优化的开源代理软件流量识别方法,该方法构建基于云的大规模流量采集与处理平台以生成完整的高质量数据集,根据机器学习理论和特征优化思想建立了具有3个独立任务的高效识别方案,并将该方案应用于完整流识别。基于云的大规模流量采集平台主要包括开源代理服务的搭建、用户行为模拟脚本的编写、服务器端流量的采集与存储、流量数据的预处理。基于特征优化的流量识别方案一方面定义了三个分类任务来实现不同角度及粒度的监管,另一方面提出了一种基于双维度的两阶段特征选择算法(TT)来为不同的识别任务构造在不同分类器下的最优特征子集,在保障分类性能的前提下满足了快速落地检测的要求。

Patent Agency Ranking