-
公开(公告)号:CN110175635A
公开(公告)日:2019-08-27
申请号:CN201910374709.0
申请日:2019-05-07
Applicant: 南京邮电大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于Bagging算法的异构多分类器OTT应用程序用户分类方法,属于机器学习技术领域。步骤如下:1.对互联网流量进行捕获,取得最初的所有IP数据包,使用网络流量生成器生成流统计特征;2.使用相应流量软件对原始IP数据包进行二次处理,执行深度包检测获得OTT应用程序,即第7层协议名称,合并流统计特征信息生成原始数据集文件;3.对原始数据集文件进行预处理后,生成用户组数据集,执行聚类分析;4.通过先前的聚类分析,使用Bagging算法构建分类模型,采用异构多分类器的方法,即基分类器使用不同的算法分类器。该方法可以通过聚类分析将用户组划分为高消费、中等消费和低消费三个集群,并通过机器学习算法良好的建立一个能够在三个识别的集群之一中对新用户进行分类的分类模型。
-
公开(公告)号:CN110175635B
公开(公告)日:2022-08-30
申请号:CN201910374709.0
申请日:2019-05-07
Applicant: 南京邮电大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于Bagging算法的异构多分类器OTT应用程序用户分类方法,属于机器学习技术领域。步骤如下:1.对互联网流量进行捕获,取得最初的所有IP数据包,使用网络流量生成器生成流统计特征;2.使用相应流量软件对原始IP数据包进行二次处理,执行深度包检测获得OTT应用程序,即第7层协议名称,合并流统计特征信息生成原始数据集文件;3.对原始数据集文件进行预处理后,生成用户组数据集,执行聚类分析;4.通过先前的聚类分析,使用Bagging算法构建分类模型,采用异构多分类器的方法,即基分类器使用不同的算法分类器。该方法可以通过聚类分析将用户组划分为高消费、中等消费和低消费三个集群,并通过机器学习算法良好的建立一个能够在三个识别的集群之一中对新用户进行分类的分类模型。
-