-
公开(公告)号:CN103970864B
公开(公告)日:2017-09-22
申请号:CN201410193638.1
申请日:2014-05-08
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于微博文本的情绪分类和情绪成分分析方法,包括以下步骤:从互联网上获取多条用户发布的微博文本;对多条微博文本进行分词,以根据每个词的词性得到多个词;从多个词中提取多个特征词;根据多个特征词训练情绪分类体系中每个节点的分类器,以构建情绪分类体系,并通过情绪分类体系实现情绪分类;根据分类结果对微博文本情绪成分进行分析。本发明实施例的方法,通过提取多个特征词构建情绪分类体系,实现情绪分类,并根据分类结果对微博文本情绪成分进行分析,不但节省了时间,提高了分类速度和分类效果,还能快速分析情绪成分,更好地满足用户的使用需求。本发明还公开了一种基于微博文本的情绪分类和情绪成分分析系统。
-
公开(公告)号:CN103970866A
公开(公告)日:2014-08-06
申请号:CN201410194170.8
申请日:2014-05-08
Applicant: 清华大学
IPC: G06F17/30
CPC classification number: G06F17/3071
Abstract: 本发明提出一种基于微博文本的微博用户兴趣发现方法,包括以下步骤:从互联网上获取数据信息,其中,数据信息包括微博文本、转发信息和关注信息;对微博文本进行分析以获取先验知识,其中,先验知识包括用户互动关系和种子词;对微博文本进行主题聚类以生成主题模型;以及将先验知识集成至主题模型中以对用户的兴趣进行发现。本发明实施例的方法能够快速的从海量微博用户及其文本中发现用户兴趣分布,另外,该方法自适应性好、易于扩展。本发明还提供了一种基于微博文本的微博用户兴趣发现系统。
-
公开(公告)号:CN103970866B
公开(公告)日:2017-11-21
申请号:CN201410194170.8
申请日:2014-05-08
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明提出一种基于微博文本的微博用户兴趣发现方法,包括以下步骤:从互联网上获取数据信息,其中,数据信息包括微博文本、转发信息和关注信息;对微博文本进行分析以获取先验知识,其中,先验知识包括用户互动关系和种子词;对微博文本进行主题聚类以生成主题模型;以及将先验知识集成至主题模型中以对用户的兴趣进行发现。本发明实施例的方法能够快速的从海量微博用户及其文本中发现用户兴趣分布,另外,该方法自适应性好、易于扩展。本发明还提供了一种基于微博文本的微博用户兴趣发现系统。
-
公开(公告)号:CN103970864A
公开(公告)日:2014-08-06
申请号:CN201410193638.1
申请日:2014-05-08
Applicant: 清华大学
IPC: G06F17/30
CPC classification number: G06F17/30705 , G06F17/30731
Abstract: 本发明公开了一种基于微博文本的情绪分类和情绪成分分析方法,包括以下步骤:从互联网上获取多条用户发布的微博文本;对多条微博文本进行分词,以根据每个词的词性得到多个词;从多个词中提取多个特征词;根据多个特征词训练情绪分类体系中每个节点的分类器,以构建情绪分类体系,并通过情绪分类体系实现情绪分类;根据分类结果对微博文本情绪成分进行分析。本发明实施例的方法,通过提取多个特征词构建情绪分类体系,实现情绪分类,并根据分类结果对微博文本情绪成分进行分析,不但节省了时间,提高了分类速度和分类效果,还能快速分析情绪成分,更好地满足用户的使用需求。本发明还公开了一种基于微博文本的情绪分类和情绪成分分析系统。
-
-
-