一种基于机器学习的图像垃圾邮件过滤方法
摘要:
本发明涉及一种基于机器学习的图像垃圾邮件过滤方法,属于计算机科学与人工智能技术领域。针对图像垃圾邮件的特点,选取更有利于区分判别垃圾邮件图像的HSV颜色直方图特征和纹理特征作为图像分类的基础数据;将以上两种特征数据应用于K‑NN算法、朴素贝叶斯算法、判别分析算法、SVM算法和随机森林算法为主的机器学习算法,将各算法取长补短提出一种集成学习算法,通过实验确定何种算法适合于何种图像特征的分类,对方法的最佳参数结构进行实验分析,确定HSV颜色直方图维度为16维,K‑NN算法的K值为5时可取得最好的分类效果。本方法使图像垃圾邮件过滤的准确率、召回率和F值同时提高到了97%,误判率降低到了3%以下。
公开/授权文献
0/0