-
公开(公告)号:CN117312468A
公开(公告)日:2023-12-29
申请号:CN202311110709.2
申请日:2023-08-30
Applicant: 杭州电子科技大学上虞科学与工程研究院有限公司
IPC: G06F16/29 , G06F16/248 , G06F40/284 , G06F18/231 , G06F18/2321 , G06Q50/00
Abstract: 本发明公开了情感特征一致性驱动的地理空间点数据采样方法。本发明方法首先对社交媒体数据集使用情感分析模型VADER进行情感分析,得到文本信息所表达的情感值;然后对所有数据项使用凝聚分层方法进行聚类,提取局部区域的情感分布,首先进行预聚类,得到预簇,然后自底向上聚类,得到聚类树;对所有预簇的数据项进行采样,保持全局情感分布和局部情感分布;采用回溯平均贡献值最低的采样节点方法,尽可能地保留全局情感分布和空间分布。本发明根据情感属性和数据项的地理位置提取多尺度区域中的情感分布,帮助用户对大规模带有地理标签的社交媒体数据进行地理空间情感分析,在简化和探索大社交媒体数据方面的具有有效性和实用性。