基于新闻标题的推荐数据处理方法及系统

    公开(公告)号:CN104915399A

    公开(公告)日:2015-09-16

    申请号:CN201510290279.6

    申请日:2015-05-29

    CPC classification number: G06F16/9535 G06F16/951

    Abstract: 本发明公开了一种基于新闻标题的推荐数据处理方法,所述方法包括:从网页中识别与实体对相关的新闻标题;计算所述实体对的关键词集合;从所述新闻标题中截取文本片段,得到带时间信息的文本片段集合,提取所述文本片段集合中各文本片段的第一特征值;计算所述文本片段集合中各个文本片段的语义向量,根据所述语义向量提取得到所述各个文本片段的第二特征值;根据用户的点击数据,将所述第一特征值和所述第二特征值拟合得到推荐理由排序。通过采用本发明,可解决现有技术中网页智能推荐理由缺乏趣味性的问题,同时使推荐理由兼顾准确性和吸引力。

    特定主题的评论数据的采集方法和装置

    公开(公告)号:CN103902674A

    公开(公告)日:2014-07-02

    申请号:CN201410103248.0

    申请日:2014-03-19

    CPC classification number: G06F17/30864

    Abstract: 本发明提出一种特定主题的评论数据的采集方法和装置。其中该方法包括:根据特定主题构造搜索词,并根据搜索词进行搜索以获取多个具有评论数据的网站;分别从多个具有评论数据的网站中提取与特定主题对应的评论数据,并根据每个网站中的评论数据的质量和/或数量从多个网站中筛选出至少一个候选网站;获取至少一个候选网站中的多个评论目标和与多个评论目标对应的多个评论数据;获取多个评论目标中属于特定主题的特定评论目标,并将特定评论目标对应的评论数据与特定主题相关联。本发明的特定主题的评论数据的采集方法,实现了互联网全局评论数据的整合,提升了评论数据的质量,自动化程度高,用户体验好。

    特定主题的评论数据的采集方法和装置

    公开(公告)号:CN103902674B

    公开(公告)日:2017-10-27

    申请号:CN201410103248.0

    申请日:2014-03-19

    Abstract: 本发明提出一种特定主题的评论数据的采集方法和装置。其中该方法包括:根据特定主题构造搜索词,并根据搜索词进行搜索以获取多个具有评论数据的网站;分别从多个具有评论数据的网站中提取与特定主题对应的评论数据,并根据每个网站中的评论数据的质量和/或数量从多个网站中筛选出至少一个候选网站;获取至少一个候选网站中的多个评论目标和与多个评论目标对应的多个评论数据;获取多个评论目标中属于特定主题的特定评论目标,并将特定评论目标对应的评论数据与特定主题相关联。本发明的特定主题的评论数据的采集方法,实现了互联网全局评论数据的整合,提升了评论数据的质量,自动化程度高,用户体验好。

    实体标签的抽取方法和装置

    公开(公告)号:CN105224642B

    公开(公告)日:2019-03-12

    申请号:CN201510625039.7

    申请日:2015-09-25

    Abstract: 本发明提出一种实体标签的抽取方法和装置,该实体标签的抽取方法包括:从网页中获取用于描述实体间共性的自然语言片段;获取满足所述自然语言片段的实体;将所述自然语言片段作为多实体标签,建立所述多实体标签与所述实体之间的关联关系。该方法能够提高能够描述的实体关系的覆盖范围,并且可以提高描述方式的自然度。

Patent Agency Ranking