一种购物评论情感分析中基于词性标注的词典构建方法

    公开(公告)号:CN105868185A

    公开(公告)日:2016-08-17

    申请号:CN201610323743.1

    申请日:2016-05-16

    CPC classification number: G06F17/2735

    Abstract: 本发明公开了一种购物评论情感分析中基于词性标注的词典构建方法,包括:对购物评论的文本数据进行预处理,即对评论文本进行分割、分词、过滤停用词、划分购物领域;构建基础情感词典与网络流行语情感词典;以购物评论语料库为数据集,对数据集进行词性标注,抽取词性为习用词、副词、形容词的词语作为候选词,通过计算候选词的PTF?IDF值选取新的情感词作为领域情感词,加入领域情感词典。采用上述领域情感词典,与基础情感词典、网络流行语情感词典相结合,对购物评论进行情感特征筛选和提取,研究购物评论的情感分类。实验表明,本发明所提出方案具有很高的准确率,且不受购物领域限制,更适于实际应用。

Patent Agency Ranking