一种基于半监督学习的社交媒体用户定位方法

    公开(公告)号:CN118194962A

    公开(公告)日:2024-06-14

    申请号:CN202311209098.7

    申请日:2023-09-19

    Abstract: 本发明提出了一种基于半监督学习的社交媒体用户定位方法,步骤为:选取真实的推特数据作为数据集,并对数据集进行预处理;采用TF‑IDF算法提取预处理后的文本数据的文本特征,构建用户文本视图;根据用户之间的社交关系构建用户的社交关系图;利用图卷积扩散算法改进社交关系图,得到稀疏图;根据用户文本视图和稀疏图,基于GCN构建用户定位模型;利用数据集对用户定位模型进行训练;将测试数据输入训练后的用户定位模型,用户定位模型的softmax层输出预测得到的用户地理位置标签。本发明能够结合大量不带地理标记的数据对用户位置进行预测;同时结合图卷积扩散算法对构造的社交关系图进行改进,从而提高地理定位的准确性。

    一种多阶段融合的多模态社交用户位置推断方法

    公开(公告)号:CN118171735A

    公开(公告)日:2024-06-11

    申请号:CN202311583010.8

    申请日:2023-11-24

    Abstract: 本发明提出了一种多阶段融合的多模态社交用户位置推断方法,步骤为:选取真实的微博数据作为用户数据,构建包含用户的文本和图像的多模态数据集;对多模态数据集中的所有图像进行特征提取得到图像特征,对多模态数据集中的所有文本进行特征提取得到文本特征;利用两个前端融合和一个中间融合分别对文本特征和图像特征进行融合;将3个融合后的特征输入训练后的用户定位模型,根据多层感知机输出3种分类结果,对分类结果进行决策层融合推断得到用户地理位置标签。本发明充分利用社交媒体中的文本和图片等多模态信息进行用户位置推断,通过融入和用户帖子具有正关联的图像特征,相对于基于文本的方法,进一步提升了社交用户定位精度。

Patent Agency Ranking