一种基于数据增强和特征融合的电影评论情感分析方法

    公开(公告)号:CN116956894A

    公开(公告)日:2023-10-27

    申请号:CN202311112045.3

    申请日:2023-08-31

    Abstract: 本发明公开了一种基于数据增强和特征融合的电影评论情感分析方法,包括:将电影评论文本通过结合TF‑IDF算法和情感词典改进的EDA数据增强并进行预处理,经过Word2Vec模型得到文本的分布式表示,分别输入到带有分段最大池化的TextCNN模型和结合注意力机制的BiLSTM模型中,拼接后输入到softmax层完成情感分类。本发明有效地降低了因在数据增强时选取到关键词和情感词改变文本的原意和情感对分类准度的影响;此外提取了文本的局部特征信息和上下文信息,保留了部分位置信息,具备了获取多次出现强特征的特征信息的能力,注意力机制还可以将注意力放在一些关键词上,提高了电影评论文本情感分类准确率。

Patent Agency Ranking