一种基于频繁词集与BERT语义的微博热点话题发现方法

    公开(公告)号:CN113032557A

    公开(公告)日:2021-06-25

    申请号:CN202110182129.9

    申请日:2021-02-09

    Inventor: 刘梦颖 王勇

    Abstract: 本发明公开了一种基于频繁词集与BERT语义的微博热点话题发现方法,首先对微博文本分别进行频繁词集挖掘和BERT句向量表示,构建基于频繁词集和BERT句向量的文本双表示模型计算文本融合相似度进行话题谱聚类,再引入H指数进行热点话题评估,然后构建基于频繁词集与BERT语义的文本双表示模型,最后进行热点话题评估分析。本发明通过分析现有的话题热度计算方法,提出用话题词热度、用户参与度并结合H指数来计算微博话题热度值,更符合微博传播特性,从更全面的角度对话题热度进行评估。

    一种基于频繁词集与BERT语义的微博热点话题发现方法

    公开(公告)号:CN113032557B

    公开(公告)日:2024-03-29

    申请号:CN202110182129.9

    申请日:2021-02-09

    Inventor: 刘梦颖 王勇

    Abstract: 本发明公开了一种基于频繁词集与BERT语义的微博热点话题发现方法,首先对微博文本分别进行频繁词集挖掘和BERT句向量表示,构建基于频繁词集和BERT句向量的文本双表示模型计算文本融合相似度进行话题谱聚类,再引入H指数进行热点话题评估,然后构建基于频繁词集与BERT语义的文本双表示模型,最后进行热点话题评估分析。本发明通过分析现有的话题热度计算方法,提出用话题词热度、用户参与度并结合H指数来计算微博话题热度值,更符合微博传播特性,从更全面的角度对话题热度进行评估。

Patent Agency Ranking