基于多维相似度的个性化新闻推荐方法

    公开(公告)号:CN102929928B

    公开(公告)日:2015-04-22

    申请号:CN201210355209.0

    申请日:2012-09-21

    Abstract: 一种基于多维相似度的个性化新闻推荐方法:先从新闻日志抽取设定时间记录,根据新闻源地址抓取新闻并抽取标题和正文,对其进行分词和提取名词,并用主题模型分析该名词序列而得到该新闻的主题特征向量;再根据新闻的主题特征向量和用户行为数据,分别构建用户模型和新闻模型;然后根据用户模型、新闻模型和时间特征分别计算用户和新闻的内容相似度与行为相似度,并据此计算最终的用户相似度和最终的新闻相似度,并分别提取最相似的多个用户和多个新闻;最后,依据最近的新闻日志记录和与设定用户最相似的多个相似用户,生成基于用户的个性化推荐结果;或依据设定用户产生行为的新闻和与该新闻最相似的多个新闻,生成基于新闻的个性化推荐结果。

    基于内容特征和主题特征的文本分组聚类方法

    公开(公告)号:CN102929906B

    公开(公告)日:2015-07-22

    申请号:CN201210285275.5

    申请日:2012-08-10

    Abstract: 本发明提供一种基于内容特征和主题特征的文本分组聚类方法,包括:提取所述文本的内容特征和主题特征;将所述主题特征转换为二进制主题特征;采用相同的分组算法对文本基于所述内容特征和所述二进制主题特征依次进行分组,获得层次化的文本分组结果;对所述文本分组结果进行聚类。使用本发明提供的基于内容特征和主题特征的文本分组聚类方法对新闻文本进行分组聚类,可以令新闻文本的聚类结果在兼顾新闻事件的针对性的基础上避免聚类结果过多的缺陷。

    基于内容特征和主题特征的文本分组聚类方法

    公开(公告)号:CN102929906A

    公开(公告)日:2013-02-13

    申请号:CN201210285275.5

    申请日:2012-08-10

    Abstract: 本发明提供一种基于内容特征和主题特征的文本分组聚类方法,包括:提取所述文本的内容特征和主题特征;将所述主题特征转换为二进制主题特征;采用相同的分组算法对文本基于所述内容特征和所述二进制主题特征依次进行分组,获得层次化的文本分组结果;对所述文本分组结果进行聚类。使用本发明提供的基于内容特征和主题特征的文本分组聚类方法对新闻文本进行分组聚类,可以令新闻文本的聚类结果在兼顾新闻事件的针对性的基础上避免聚类结果过多的缺陷。

    基于新闻内容和主题特征的个性化新闻推荐装置和方法

    公开(公告)号:CN102831234B

    公开(公告)日:2015-04-22

    申请号:CN201210320475.X

    申请日:2012-08-31

    Abstract: 一种基于新闻内容和主题特征的个性化新闻推荐装置和方法,推荐装置设有:新闻抓取、预处理、主题模型训练、主题模型预测、用户模型构建、新闻推荐和推荐处理共七个模块。推荐方法是:利用主题模型和相关的命名实体名词序列构建个性化用户模型来表示用户阅读新闻的兴趣偏好,并对该用户的主题特征向量进行权值计算与转换以降低热门主题及新闻内容单一对用户兴趣的影响,有效解决了用户兴趣集中、且推荐结果多样性不足的缺陷。在推荐输出阶段,对初始推荐新闻列表进行处理,在现有的重复数据删除和冗余过滤的基础上,添加了基于本发明个性化用户模型的主题分组过程,并对新闻文本按照时效权值重新排序,实现准确、多样、新颖的个性化新闻推荐。

    基于多维相似度的个性化新闻推荐方法

    公开(公告)号:CN102929928A

    公开(公告)日:2013-02-13

    申请号:CN201210355209.0

    申请日:2012-09-21

    Abstract: 一种基于多维相似度的个性化新闻推荐方法:先从新闻日志抽取设定时间记录,根据新闻源地址抓取新闻并抽取标题和正文,对其进行分词和提取名词,并用主题模型分析该名词序列而得到该新闻的主题特征向量;再根据新闻的主题特征向量和用户行为数据,分别构建用户模型和新闻模型;然后根据用户模型、新闻模型和时间特征分别计算用户和新闻的内容相似度与行为相似度,并据此计算最终的用户相似度和最终的新闻相似度,并分别提取最相似的多个用户和多个新闻;最后,依据最近的新闻日志记录和与设定用户最相似的多个相似用户,生成基于用户的个性化推荐结果;或依据设定用户产生行为的新闻和与该新闻最相似的多个新闻,生成基于新闻的个性化推荐结果。

    基于新闻内容和主题特征的个性化新闻推荐装置和方法

    公开(公告)号:CN102831234A

    公开(公告)日:2012-12-19

    申请号:CN201210320475.X

    申请日:2012-08-31

    Abstract: 一种基于新闻内容和主题特征的个性化新闻推荐装置和方法,推荐装置设有:新闻抓取、预处理、主题模型训练、主题模型预测、用户模型构建、新闻推荐和推荐处理共七个模块。推荐方法是:利用主题模型和相关的命名实体名词序列构建个性化用户模型来表示用户阅读新闻的兴趣偏好,并对该用户的主题特征向量进行权值计算与转换以降低热门主题及新闻内容单一对用户兴趣的影响,有效解决了用户兴趣集中、且推荐结果多样性不足的缺陷。在推荐输出阶段,对初始推荐新闻列表进行处理,在现有的重复数据删除和冗余过滤的基础上,添加了基于本发明个性化用户模型的主题分组过程,并对新闻文本按照时效权值重新排序,实现准确、多样、新颖的个性化新闻推荐。

Patent Agency Ranking