一种针对新闻长文本的谣言检测方法及系统

    公开(公告)号:CN110032733A

    公开(公告)日:2019-07-19

    申请号:CN201910184862.7

    申请日:2019-03-12

    Abstract: 本发明涉及一种针对新闻长文本的谣言检测方法及系统,包括:获取指定新闻平台中大于预设字数的文本作为长文本,提取长文本中段落的关键词,并以该关键词检索社交平台获取社交数据,使用文本相关性算法获得该段落的相关数据;获取标注数据集,标注数据集包括已标注谣言信息的多个社交数据,使用标注数据集训练多个分类模型,并将训练完成的分类模型集合为融合模型,使用融合模型得到相关数据的可信度得分,用以代表段落为非谣言的概率。本发明使用异源检测方法解决了难以对长文直接判别的问题。

Patent Agency Ranking