一种基于主动学习迭代的社交媒体谣言检测方法

    公开(公告)号:CN117992651A

    公开(公告)日:2024-05-07

    申请号:CN202410180591.9

    申请日:2024-02-18

    Abstract: 本发明公开了一种基于主动学习迭代的社交媒体谣言检测方法,属于自然语言处理技术领域,包括:使用预训练语言模型来表征样本;通过无监督的对比学习方法,利用无标签样本池中的数据,对Bert模型进行训练调优;通过基于样本标签距离的主动学习查询策略,分别更新无标签样本池和有标签样本池;按照样本标签和领域对有标签样本进行增广;通过有监督的对比学习方法,利用有标签样本池中的数据,对Bert模型进行训练调优;更新软提示前缀编码;更新当前样本池,将原有的无标签样本池纳入到领域下的无标签样本池中,重新训练模型。本发明在保持模型精度的前提下,降低了社交媒体数据样本标记成本,并在零样本场景下改善了谣言检测性能。

Patent Agency Ranking