一种基于Ap增量聚类和网络基元的热点话题预测方法

    公开(公告)号:CN109857869A

    公开(公告)日:2019-06-07

    申请号:CN201910076648.X

    申请日:2019-01-26

    Abstract: 本发明公开了一种基于Ap增量聚类和网络基元的热点话题预测方法,获取推文数据;推文数据预处理;Ap增量聚类的话题发现;基于用户网络的网络基元的热点话题预测。在基础上检测、发现网络基元的特征信息,当基元数量超过指定域值时判断该话题将可能成为突发事件,事件趋势即将可能进入爆发阶段。利用中心向量提取相关术语然后从Lucene索引中检索相关高相似度的推文。在Ap聚类的基础上引入了历史推文术语相似性分析,以扩展Ap聚类中心向量提高增量聚类算法的准确性,使得其能够更加精准的增量聚类与事件相关的推文集。在此事件聚类事件发现的基础上,另辟蹊径通过构造、发现、统计用户信息网络的网络基元的特性信息实现对热点的事件的提前预测和感知。

    一种基于Ap增量聚类和网络基元的热点话题预测方法

    公开(公告)号:CN109857869B

    公开(公告)日:2021-07-30

    申请号:CN201910076648.X

    申请日:2019-01-26

    Abstract: 本发明公开了一种基于Ap增量聚类和网络基元的热点话题预测方法,获取推文数据;推文数据预处理;Ap增量聚类的话题发现;基于用户网络的网络基元的热点话题预测。在基础上检测、发现网络基元的特征信息,当基元数量超过指定域值时判断该话题将可能成为突发事件,事件趋势即将可能进入爆发阶段。利用中心向量提取相关术语然后从Lucene索引中检索相关高相似度的推文。在Ap聚类的基础上引入了历史推文术语相似性分析,以扩展Ap聚类中心向量提高增量聚类算法的准确性,使得其能够更加精准的增量聚类与事件相关的推文集。在此事件聚类事件发现的基础上,另辟蹊径通过构造、发现、统计用户信息网络的网络基元的特性信息实现对热点的事件的提前预测和感知。

Patent Agency Ranking