-
公开(公告)号:CN112765660A
公开(公告)日:2021-05-07
申请号:CN202110092700.8
申请日:2021-01-25
Applicant: 湖南大学 , 湖南匡安网络技术有限公司
IPC: G06F21/62 , G06F21/57 , G06F40/216 , G06F40/289 , G06K9/62
Abstract: 本发明公开了一种基于MapReduce并行聚类技术的终端安全性分析方法,包括:从终端获取其日志数据,并使用自然语言处理库对日志数据进行处理,以得到多个分词;对得到的多个分词进行过滤处理,以得到过滤后的多个分词;使用TF‑IDF算法提取过滤后的每个分词的特征,所有特征构成该日志数据对应的日志向量X;计算得到的日志数据对应的日志向量与预先设置的K个聚类中心中每个聚类中心的欧氏距离,并获取所有欧氏距离的最小值所对应的聚类中心,根据该聚类中心确定终端的最终安全等级。本发明能够降低噪声日志干扰带来的影响,并且能解决现有终端安全性判断的人力成本高、速度慢,分类结果受不同技术人员自身经验影响,以及传统终端安全分类方法的不准确的问题。