基于机器学习的网络流量分类方法及装置

    公开(公告)号:CN116582300A

    公开(公告)日:2023-08-11

    申请号:CN202310386039.0

    申请日:2023-04-12

    Abstract: 本发明公开了一种基于机器学习的网络流量分类方法及装置,所述方法包括:获取包含正常流量和异常流量的训练数据集;基于训练数据集中样本的近邻,计算样本的刚度IH;根据刚度IH,将训练数据集划分为易集和难集;根据类别的样本数量,将难集划分为多数类样本集和少数类样本集;对多数类样本集进行K‑means聚类,并用聚类中心代替每个簇中的样本,以得到样本集SK;对多数类样本集进行SMOTE过采样,以得到样本集SZ;合并易集、少数类样本集、样本集SK和样本集SZ,得到训练数据集SN;基于训练数据集SK对网络流量分类模型进行训练;使用训练后的网络流量分类模型进行待检测流量的预测,得到该待检测流量的分类结果。本发明可以提高网络流量分类模型的准确率。

Patent Agency Ranking