-
公开(公告)号:CN109412969B
公开(公告)日:2021-10-26
申请号:CN201811104919.X
申请日:2018-09-21
Applicant: 华南理工大学
IPC: H04L12/851
Abstract: 本发明公开了一种移动App流量统计特征选择方法,该方法包括:S1、获取原始移动App的流量数据集,提取移动App流量的流统计特征,获取用于训练的有标记数据集LD,以及待分类的无标记数据集UD;S2、在LD数据集上,利用信息增益率,评估每个流统计特征在类间的区分能力;S3、在LD和UD数据集上,计算每个流统计特征的取值分布,利用Hellinger距离评估特征取值分布差异性,评估流统计特征的漂移程度;S4、将漂移程度作为区分能力的惩罚因子,计算流统计特征的综合评估值;S5、基于综合评估值,搜索区分能力强且漂移程度低的流统计特征子集。本发明的方法涉及移动互联网流量测量领域的移动App流量分类技术,降低数据维度,并提高分类鲁棒性能。
-
公开(公告)号:CN109412969A
公开(公告)日:2019-03-01
申请号:CN201811104919.X
申请日:2018-09-21
Applicant: 华南理工大学
IPC: H04L12/851
Abstract: 本发明公开了一种移动App流量统计特征选择方法,该方法包括:S1、获取原始移动App的流量数据集,提取移动App流量的流统计特征,获取用于训练的有标记数据集LD,以及待分类的无标记数据集UD;S2、在LD数据集上,利用信息增益率,评估每个流统计特征在类间的区分能力;S3、在LD和UD数据集上,计算每个流统计特征的取值分布,利用Hellinger距离评估特征取值分布差异性,评估流统计特征的漂移程度;S4、将漂移程度作为区分能力的惩罚因子,计算流统计特征的综合评估值;S5、基于综合评估值,搜索区分能力强且漂移程度低的流统计特征子集。本发明的方法涉及移动互联网流量测量领域的移动App流量分类技术,降低数据维度,并提高分类鲁棒性能。
-
公开(公告)号:CN111563234A
公开(公告)日:2020-08-21
申请号:CN202010328975.2
申请日:2020-04-23
Applicant: 华南理工大学
Abstract: 本发明公开了一种主机异常检测中系统调用数据的特征提取方法。所述方法包括以下步骤:获取应用程序在运行期间的系统调用序列记录,在每个序列记录上,提取系统调用的n-gram数值序列;在每个系统调用序列记录上,基于提取的n-gram数值序列,获得n-gram频数序列;在每个n-gram频数序列上,进行K个统计值计算,将K个统计值作为特征值。本发明的方法涉及基于主机的异常检测领域,将不等长的系统调用序列转化为K个统计值描述的特征向量,此特征向量独立于系统调用的采集平台,可实现跨平台。
-
-