-
公开(公告)号:CN112347259A
公开(公告)日:2021-02-09
申请号:CN202011283488.5
申请日:2020-11-17
Applicant: 河北工程大学
IPC: G06F16/35 , G06F40/289 , G06F40/242
Abstract: 本发明公开一种结合词典与机器学习的文本情感分析方法,其包括以下步骤:S1、获取评论文本;S2、将评论文本做数据清洗和去停用词操作;S3、提取特征词;S4、将特征词转化为词频向量;S5、判断特征词是否为情感词,若特征词不是情感词则用公式(2)计算特征词权重;若特征词是情感词则先判断情感词的前后三个词中是否存在程度副词,若不存在程度副词则用公式(4)计算特征词权重;若存在程度副词则使用公式(6)计算特征词权重;S6、根据获得的特征词权重,使用SVM算法进行情感倾向分类。采用本发明的结合词典与机器学习的文本情感分析方法能实现精确地对评论文本进行情感分类。