-
公开(公告)号:CN110175325A
公开(公告)日:2019-08-27
申请号:CN201910343337.5
申请日:2019-04-26
Applicant: 南京邮电大学
IPC: G06F17/27 , G06F16/9532 , G06Q30/06
Abstract: 本发明提出了数据分析领域内的一种基于词向量和句法特征的评论分析方法,包括:获取电商网站商品页面评论数据;将获取的目标数据集进行预处理;提取Hownet和NTU提供的褒贬词集组成基础情感词典;将所得到的经过预处理的数据集合通过Word2Vec工具进行词向量训练;使用语义相似度矩阵建立概率转移矩阵;将获取的商品评论文本,进行基于核心句规则的处理;将所得到的去除冗余的文本进行预处理;对所得依存关系对通过词性提取 评价搭配对;将所得评价搭配对结合情感词典,对评价对象进行褒贬值计算、优劣排序,最终通过可视化交互界面实现,实现对商品评论数据进行准确、实时、自动、便利的处理与分析,可用于电商平台中。
-
公开(公告)号:CN110175325B
公开(公告)日:2023-07-11
申请号:CN201910343337.5
申请日:2019-04-26
Applicant: 南京邮电大学
IPC: G06F40/242 , G06F16/9532 , G06F40/30 , G06F40/284 , G06Q30/0601
Abstract: 本发明提出了数据分析领域内的一种基于词向量和句法特征的评论分析方法,包括:获取电商网站商品页面评论数据;将获取的目标数据集进行预处理;提取Hownet和NTU提供的褒贬词集组成基础情感词典;将所得到的经过预处理的数据集合通过Word2Vec工具进行词向量训练;使用语义相似度矩阵建立概率转移矩阵;将获取的商品评论文本,进行基于核心句规则的处理;将所得到的去除冗余的文本进行预处理;对所得依存关系对通过词性提取 评价搭配对;将所得评价搭配对结合情感词典,对评价对象进行褒贬值计算、优劣排序,最终通过可视化交互界面实现,实现对商品评论数据进行准确、实时、自动、便利的处理与分析,可用于电商平台中。
-