-
公开(公告)号:CN103902674B
公开(公告)日:2017-10-27
申请号:CN201410103248.0
申请日:2014-03-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提出一种特定主题的评论数据的采集方法和装置。其中该方法包括:根据特定主题构造搜索词,并根据搜索词进行搜索以获取多个具有评论数据的网站;分别从多个具有评论数据的网站中提取与特定主题对应的评论数据,并根据每个网站中的评论数据的质量和/或数量从多个网站中筛选出至少一个候选网站;获取至少一个候选网站中的多个评论目标和与多个评论目标对应的多个评论数据;获取多个评论目标中属于特定主题的特定评论目标,并将特定评论目标对应的评论数据与特定主题相关联。本发明的特定主题的评论数据的采集方法,实现了互联网全局评论数据的整合,提升了评论数据的质量,自动化程度高,用户体验好。
-
公开(公告)号:CN103902674A
公开(公告)日:2014-07-02
申请号:CN201410103248.0
申请日:2014-03-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明提出一种特定主题的评论数据的采集方法和装置。其中该方法包括:根据特定主题构造搜索词,并根据搜索词进行搜索以获取多个具有评论数据的网站;分别从多个具有评论数据的网站中提取与特定主题对应的评论数据,并根据每个网站中的评论数据的质量和/或数量从多个网站中筛选出至少一个候选网站;获取至少一个候选网站中的多个评论目标和与多个评论目标对应的多个评论数据;获取多个评论目标中属于特定主题的特定评论目标,并将特定评论目标对应的评论数据与特定主题相关联。本发明的特定主题的评论数据的采集方法,实现了互联网全局评论数据的整合,提升了评论数据的质量,自动化程度高,用户体验好。
-