一种基于超图注意力网络的社交媒体贴文真实性检测方法

    公开(公告)号:CN113254652B

    公开(公告)日:2021-09-17

    申请号:CN202110746155.X

    申请日:2021-07-01

    Applicant: 中南大学

    Abstract: 本发明涉及贴文检测的技术领域,公开了一种基于超图注意力网络的社交媒体贴文真实性检测方法,具体包括如下步骤:S1:对社交媒体贴文文本数据的数据预处理,划分为会话,回复分支,帖子的层级结构;S2:对经S1处理后的社交媒体贴文文本数据进行帖子属性特征提取;S3:对经S1处理后的社交媒体贴文文本数据进行帖子文本嵌入;S4:将S2和S3得到的向量拼接,作为超图结构的图节点;S5:将回复分支作为超边,超边与图节点组成的集合,共同构成超图,将超图结构的特征输入图注意力网络学习,从而构建超图注意力网络模型;S6:将S5中超图注意力网络模型用于预测源帖的真实性。本发明构建超图注意力模型,提高模型表达能力。

    一种基于超图注意力网络的社交媒体贴文真实性检测方法

    公开(公告)号:CN113254652A

    公开(公告)日:2021-08-13

    申请号:CN202110746155.X

    申请日:2021-07-01

    Applicant: 中南大学

    Abstract: 本发明涉及贴文检测的技术领域,公开了一种基于超图注意力网络的社交媒体贴文真实性检测方法,具体包括如下步骤:S1:对社交媒体贴文文本数据的数据预处理,划分为会话,回复分支,帖子的层级结构;S2:对经S1处理后的社交媒体贴文文本数据进行帖子属性特征提取;S3:对经S1处理后的社交媒体贴文文本数据进行帖子文本嵌入;S4:将S2和S3得到的向量拼接,作为超图结构的图节点;S5:将回复分支作为超边,超边与图节点组成的集合,共同构成超图,将超图结构的特征输入图注意力网络学习,从而构建超图注意力网络模型;S6:将S5中超图注意力网络模型用于预测源帖的真实性。本发明构建超图注意力模型,提高模型表达能力。

    基于注意力机制和干扰词删除的中文文本分类方法

    公开(公告)号:CN112749274A

    公开(公告)日:2021-05-04

    申请号:CN201911045593.2

    申请日:2019-10-30

    Applicant: 中南大学

    Abstract: 本发明提供一种基于注意力机制和干扰词删除的中文文本分类方法,包括步骤一对原始中文文本语料做预处理;步骤二将处理为词嵌入的语料输入双向LSTM层中提取文本特征得到文本表达;步骤三通过注意力机制提取重要词特征;步骤四将注意力机制标记出的重要词特征筛选排序;步骤五计算将预测结果切换到另一个类的异常干扰词,定位这种干扰词,做删除屏蔽的处理;步骤六用删除定量干扰词的方式调整训练分类器,并反向训练文本表达,得到训练参数;步骤七模型测试,将测试集词向量构成的词嵌入矩阵输入到训练好的模型中,得到概率矩阵后,输入分类器输出文本类别,最后与真实值比较得到预测值的精确度。本发明在提高中文文本分类的准确性的同时,评估删除屏蔽干扰词对分类的影响,增加了分类器的可解释性。

    基于注意力机制和干扰词删除的中文文本分类方法

    公开(公告)号:CN112749274B

    公开(公告)日:2022-11-18

    申请号:CN201911045593.2

    申请日:2019-10-30

    Applicant: 中南大学

    Abstract: 本发明提供一种基于注意力机制和干扰词删除的中文文本分类方法,包括步骤一对原始中文文本语料做预处理;步骤二将处理为词嵌入的语料输入双向LSTM层中提取文本特征得到文本表达;步骤三通过注意力机制提取重要词特征;步骤四将注意力机制标记出的重要词特征筛选排序;步骤五计算将预测结果切换到另一个类的异常干扰词,定位这种干扰词,做删除屏蔽的处理;步骤六用删除定量干扰词的方式调整训练分类器,并反向训练文本表达,得到训练参数;步骤七模型测试,将测试集词向量构成的词嵌入矩阵输入到训练好的模型中,得到概率矩阵后,输入分类器输出文本类别,最后与真实值比较得到预测值的精确度。本发明在提高中文文本分类的准确性的同时,评估删除屏蔽干扰词对分类的影响,增加了分类器的可解释性。

    一种基于多任务学习的社交媒体谣言检测方法

    公开(公告)号:CN112685541B

    公开(公告)日:2021-05-25

    申请号:CN202110269307.1

    申请日:2021-03-11

    Applicant: 中南大学

    Abstract: 本发明涉及一种基于多任务学习的社交媒体谣言检测方法,具体包括如下步骤:S1:对语料进行数据提取及格式转换,获取帖子的源、回复及传播路径;S2:提取行文风格的特征;S3:提取用户置信度的特征;S4:对来源帖子及回复帖子中的文本部分做文本预处理,来输入后续任务;S5:将S2和S3提取到的特征与S4的文本表示做向量拼接;S6:将拼接后的向量放入一个共享的BERT层;S7:分别构建神经网络结构;S8:将S5处理后的数据输入神经网络结构中,输出立场分类和谣言分类。本发明能用多任务联合模型联合两个高度相关的任务,改进了谣言检测和立场分类任务,提高了谣言检测性能。

    一种基于多任务学习的社交媒体谣言检测方法

    公开(公告)号:CN112685541A

    公开(公告)日:2021-04-20

    申请号:CN202110269307.1

    申请日:2021-03-11

    Applicant: 中南大学

    Abstract: 本发明涉及一种基于多任务学习的社交媒体谣言检测方法,具体包括如下步骤:S1:对语料进行数据提取及格式转换,获取帖子的源、回复及传播路径;S2:提取行文风格的特征;S3:提取用户置信度的特征;S4:对来源帖子及回复帖子中的文本部分做文本预处理,来输入后续任务;S5:将S2和S3提取到的特征与S4的文本表示做向量拼接;S6:将拼接后的向量放入一个共享的BERT层;S7:分别构建神经网络结构;S8:将S5处理后的数据输入神经网络结构中,输出立场分类和谣言分类。本发明能用多任务联合模型联合两个高度相关的任务,改进了谣言检测和立场分类任务,提高了谣言检测性能。

Patent Agency Ranking