-
公开(公告)号:CN113032557A
公开(公告)日:2021-06-25
申请号:CN202110182129.9
申请日:2021-02-09
Applicant: 北京工业大学
IPC: G06F16/35 , G06F16/335 , G06F16/951 , G06F16/9536 , G06F40/194 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种基于频繁词集与BERT语义的微博热点话题发现方法,首先对微博文本分别进行频繁词集挖掘和BERT句向量表示,构建基于频繁词集和BERT句向量的文本双表示模型计算文本融合相似度进行话题谱聚类,再引入H指数进行热点话题评估,然后构建基于频繁词集与BERT语义的文本双表示模型,最后进行热点话题评估分析。本发明通过分析现有的话题热度计算方法,提出用话题词热度、用户参与度并结合H指数来计算微博话题热度值,更符合微博传播特性,从更全面的角度对话题热度进行评估。
-
公开(公告)号:CN113032557B
公开(公告)日:2024-03-29
申请号:CN202110182129.9
申请日:2021-02-09
Applicant: 北京工业大学
IPC: G06F16/35 , G06F16/335 , G06F16/951 , G06F16/9536 , G06F40/194 , G06F40/289 , G06F40/30 , G06F18/23213
Abstract: 本发明公开了一种基于频繁词集与BERT语义的微博热点话题发现方法,首先对微博文本分别进行频繁词集挖掘和BERT句向量表示,构建基于频繁词集和BERT句向量的文本双表示模型计算文本融合相似度进行话题谱聚类,再引入H指数进行热点话题评估,然后构建基于频繁词集与BERT语义的文本双表示模型,最后进行热点话题评估分析。本发明通过分析现有的话题热度计算方法,提出用话题词热度、用户参与度并结合H指数来计算微博话题热度值,更符合微博传播特性,从更全面的角度对话题热度进行评估。
-