一种基于动态图注意力胶囊网络的谣言检测方法与装置

    公开(公告)号:CN114757185B

    公开(公告)日:2025-05-06

    申请号:CN202210421678.1

    申请日:2022-04-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于动态图注意力胶囊网络的谣言检测方法与装置,能够对社交媒体中的帖子进行谣言识别,从而提供给用户检测谣言的预判机制。本发明首先使用动态网络框架DYN对谣言传播过程中积累的评论以时间顺序进行划分,形成多个静态的以图为基础的子评论结构;然后利用图注意力胶囊网络模块GACN对每个子评论结构进行编码形成子结构分类胶囊,从而挖掘谣言文本的属性特征;最后设计分类胶囊注意力机制整合各子分类胶囊捕获谣言评论结构随时间动态演化过程中的动态交互特征,进而获得谣言检测结果。本发明能够有效挖掘谣言文本深层次的属性以及评论结构随时间演化的动态交互特征,提升了谣言检测任务的准确率。

    一种融合关键信息的摘要生成方法

    公开(公告)号:CN113111663B

    公开(公告)日:2024-09-06

    申请号:CN202110467022.9

    申请日:2021-04-28

    Applicant: 东南大学

    Abstract: 本发明公开了一种融合关键信息的摘要生成方法,能够为媒体文本自动地生成摘要。本发明首先通过互联网采集媒体文本,并在媒体文本基础上按人工规则生成标准摘要构造出样本数据集;然后对数据集进行预处理,生成训练模型的输入数据;接着构建基于关键信息融合的seq2seq摘要生成模型,并联合三元组损失与交叉熵损失进行模型训练;最后基于训练完毕后的模型进行输出模型的构建,并利用输出模型对待进行摘要的媒体文本进行自动摘要生成。与现有技术相比,本发明联合关键词与主题信息作为关键信息,能够多层次地对摘要生成过程进行引导,从而提高摘要结果的信息覆盖度与主题一致性。

    一种基于UCL知识空间的实体消歧方法及装置

    公开(公告)号:CN113111136B

    公开(公告)日:2024-04-16

    申请号:CN202110475291.X

    申请日:2021-04-29

    Applicant: 东南大学

    Abstract: 本发明提供了一种基于UCL知识空间的实体消歧方法及装置,首先构建基础知识库,完成UCL知识空间的构建;随后从UCL知识空间中获取待消歧实体相关的候选实体集合,利用词向量表示方法生成候选实体和待消歧实体的嵌入表示;接着抽取待消歧实体及其上下文的概念特征,抽取候选实体上下文的特征;最后利用之前生成的四个向量表示作为输入,采用基于深度结构化语义匹配模型DSSM的自注意力匹配网络,获得匹配度;根据匹配结果的排序得到最终消歧结果,完成文本中实体与UCL知识空间中实体的实体链接。本发明既能够解决短文本中实体相关信息较少的问题,还能提高实体消歧的准确度。

    一种融合句法结构信息的关键词生成方法及装置

    公开(公告)号:CN114692605B

    公开(公告)日:2025-05-06

    申请号:CN202210415569.9

    申请日:2022-04-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种融合句法结构信息的关键词生成方法及装置,能够为新闻文章自动地生成关键词。本发明首先使用爬虫工具采集新闻文章,并采取人工标注参考关键词构造出新闻文章数据集;然后对文本进行预处理,依存句法分析和过滤停用词;接着基于循环神经网络的顺序编码器和基于图卷积网络的图编码器分别获取文章的上下文语义和结构特征,并利用聚类方法将文本分为包含不同子主题部分,并利用多个基于注意力机制的解码器并行生成关键词;采样交叉熵损失进行模型参数优化;最后基于训练后的模型对待处理的新闻文章进行自动关键词生成。本发明通过句法结构信息弥补顺序编码存在的长距离单词依赖信息损失问题,从而提高生成关键词的质量。

    一种基于知识图谱路径的隐式推荐方法

    公开(公告)号:CN113094587B

    公开(公告)日:2024-04-16

    申请号:CN202110443867.4

    申请日:2021-04-23

    Applicant: 东南大学

    Abstract: 本发明提供了一种基于知识图谱路径的隐式推荐方法,包括如下步骤:在知识图谱中提取用户和候选item之间的路径;将路径输入注意力知识路径模块AKPM中,捕获知识图谱中用户和候选item之间的显式特征;将用户的历史交互记录和候选item输入IFEM中,捕获知识图谱之外的隐式特征;融合显式和隐式特征向量得到推荐分数。本发明充分利用用户的行为记录,在捕获用户和候选item之间的显式特征的同时,还能够捕获知识图谱之外item之间的知识图谱之外的隐式特征,将显式和隐式特征融合并用于推荐,相比其他方法,本发明方法推荐准确率高,可解释性好。

    一种面向表格型数据的事实验证方法

    公开(公告)号:CN114925211A

    公开(公告)日:2022-08-19

    申请号:CN202210385244.0

    申请日:2022-04-13

    Applicant: 东南大学

    Abstract: 本发明公开了一种面向表格型数据的事实验证方法,能够用于检验网络上声明的真实性,包括如下步骤:首先针对输入的表格数据和文本声明,利用DeBERTa模型获得单一模态的编码表示;然后将单一模态的编码表示作为交叉模态Transformer模块的输入,分别获得融合模态间信息的表格表示和文本声明表示;最后通过构建一个图神经网络,提取表格的结构信息以及文本的语义信息来进行信息传递和推理;最后利用一个多层感知器获得声明真实性的预测结果,本发明结合图神经网络来对表格数据进行表示,并联合多模态技术增强文本声明和表格数据之间的交互,增强了模型的表示学习能力和推理能力,从而提高了声明真实性预测的准确性。

    一种基于迁移学习的情感极性分析方法

    公开(公告)号:CN113326695A

    公开(公告)日:2021-08-31

    申请号:CN202110455888.8

    申请日:2021-04-26

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于迁移学习的情感极性分析方法,本发明首先构建文本排序模型,弥补当前语言模型缺乏句子级预训练任务的缺陷,提高模型的逻辑感知与语义表达能力。然后,构建情感极性分析模型,将文本排序模型训练得到的相关参数迁移到情感极性分析模型中对应的位置。最后,将迁移后的模型在情感极性分析数据集上继续训练。本发明利用迁移学习为情感极性分析模型引入领域先验知识,可以提高模型的领域适应性,有助于获取更高质量的句子特征,进而提高模型的分类准确率,并且,本发明所采用的注意力机制可以为情感极性分析模型降低评论文本的噪声干扰,提高模型的分类鲁棒性。

    一种基于深度学习的方面级情感分类方法

    公开(公告)号:CN114692604B

    公开(公告)日:2025-02-21

    申请号:CN202210398830.9

    申请日:2022-04-16

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度学习的方面级情感分类方法,具体如下,构筑方面级情感分类数据集;将数据集中的方面级特征嵌入到语义空间中;使用基于对抗BERT的编码器进行特征编码;基于线性变换的方面级句子特征压缩层对编码后的结果进行线性变换,使其满足胶囊网络计算的需要;基于胶囊网络的方面级句子特征提取层对压缩后的矩阵进一步的特征提取,捕获方面词与其对应上下文的语义关系;融标签正则化机制的情感分类层依据模型学习到的内容对文本进行方面级情感分类,可用于社交媒体文本的方面级情感分类,本发明基于对句子的方面级特征进行充分地学习,结合对抗训练机制将数据集的效果发挥到最大化,在复杂的场景下仍能表现出良好的效果,具有准确率高、鲁棒性好的特点。

    一种基于多尺度特征的人体图像解析方法

    公开(公告)号:CN113111848A

    公开(公告)日:2021-07-13

    申请号:CN202110477075.9

    申请日:2021-04-29

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多尺度特征的人体图像解析方法。本发明首先利用残差网络对人体图像不断进行下采样;然后利用双线性插值和通道压缩的方法不断对人体特征图进行上采样;最后通过多尺度特征融合的方式将上采样和上采样过程中产生的人体特征图进行多尺度特征融合,以同时利用不同感受野大小的人体图像信息。本发明利用不同倍率的空洞卷积做多尺度特征融合,有效解决传统人体解析方法对于人体边缘检测像素精度不够的问题,相比现有特征融合方法能大幅提高效率和精度。

    一种媒体文本相似性检测方法

    公开(公告)号:CN113111645A

    公开(公告)日:2021-07-13

    申请号:CN202110469854.4

    申请日:2021-04-28

    Applicant: 东南大学

    Abstract: 本发明涉及一种媒体文本相似性检测方法,该方法能够在海量的媒体文本中检测到与目标文本相似的媒体文本,本发明首先使用爬虫工具获得主流自媒体平台的媒体文本,构建媒体文本集;然后对媒体文本进行预处理提取正文字段,并进行分词和停用词过滤;接着,基于海量语料库训练Skip‑gram模型获得特征项的词向量表示;再者,使用词语的TF‑IDF特征,词性特征与位置特征进行特征融合,构建特征项的权重;最后基于特征项的词向量表示和权重使用Simhash算法获得文本指纹,并根据倒排索引构建文本指纹索引。本发明可以有效增强文本指纹的语义特征,提高Simhash算法对相似文本的检索效率和准确度。

Patent Agency Ranking