-
公开(公告)号:CN109241518A
公开(公告)日:2019-01-18
申请号:CN201710559558.7
申请日:2017-07-11
Applicant: 北京交通大学
IPC: G06F17/27 , G06F16/958 , G06K9/62
Abstract: 本发明提供了一种基于情感分析的检测网络水军方法,其特征在于,包括:获取网页评论数据,将所述评论数据进行数据预处理,将预处理过的数据分为测试数据集和训练数据集,将两种数据集构建成语料库,并进行手动情感分类,将两种数据集进行文本预处理后,运用设定分类器对训练数据集进行数据处理,生成分类模型,利用测试数据集测试分类模型精确度,然后运用已生成精确度高的分类模型对待检测数据进行自动情感分类;最后进行数据规则匹配,检测出网络水军。本发明集成了数据爬取、数据预处理、词袋模型建立、分类器构建以及规则设置五个功能模块,实现对网络水军进行快速检测的算法,在提高算法检测速度的同时,保证对用户评论的情感分类精确度。
-
公开(公告)号:CN109241518B
公开(公告)日:2021-01-22
申请号:CN201710559558.7
申请日:2017-07-11
Applicant: 北京交通大学
IPC: G06F40/289 , G06F16/958 , G06K9/62
Abstract: 本发明提供了一种基于情感分析的检测网络水军方法,其特征在于,包括:获取网页评论数据,将所述评论数据进行数据预处理,将预处理过的数据分为测试数据集和训练数据集,将两种数据集构建成语料库,并进行手动情感分类,将两种数据集进行文本预处理后,运用设定分类器对训练数据集进行数据处理,生成分类模型,利用测试数据集测试分类模型精确度,然后运用已生成精确度高的分类模型对待检测数据进行自动情感分类;最后进行数据规则匹配,检测出网络水军。本发明集成了数据爬取、数据预处理、词袋模型建立、分类器构建以及规则设置五个功能模块,实现对网络水军进行快速检测的算法,在提高算法检测速度的同时,保证对用户评论的情感分类精确度。
-