-
公开(公告)号:CN119862279A
公开(公告)日:2025-04-22
申请号:CN202411953534.6
申请日:2024-12-27
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/35 , G06F40/284 , G06F18/22
Abstract: 本发明提供一种网络文本数据的热点获取方法和热点热度分析方法,包括依据热点规则过滤网络数据,提取与热点相关的若干数据元;数据元分词处理以获取特征词,依据特征词生成数据元向量;基于聚类策略确定数据元向量的内若干聚类中心,合并相似聚类中心以确定类中心,以类中心表示热点,所述所述数据元包括文本特征和非文本特征。本发明通过将数据元内多角度数据融合至一个数据元向量内,提高热点发现的准确性。