-
公开(公告)号:CN114757185A
公开(公告)日:2022-07-15
申请号:CN202210421678.1
申请日:2022-04-21
Applicant: 东南大学
IPC: G06F40/289 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于动态图注意力胶囊网络的谣言检测方法与装置,能够对社交媒体中的帖子进行谣言识别,从而提供给用户检测谣言的预判机制。本发明首先使用动态网络框架DYN对谣言传播过程中积累的评论以时间顺序进行划分,形成多个静态的以图为基础的子评论结构;然后利用图注意力胶囊网络模块GACN对每个子评论结构进行编码形成子结构分类胶囊,从而挖掘谣言文本的属性特征;最后设计分类胶囊注意力机制整合各子分类胶囊捕获谣言评论结构随时间动态演化过程中的动态交互特征,进而获得谣言检测结果。本发明能够有效挖掘谣言文本深层次的属性以及评论结构随时间演化的动态交互特征,提升了谣言检测任务的准确率。
-
公开(公告)号:CN114692605A
公开(公告)日:2022-07-01
申请号:CN202210415569.9
申请日:2022-04-20
Applicant: 东南大学
IPC: G06F40/211 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合句法结构信息的关键词生成方法及装置,能够为新闻文章自动地生成关键词。本发明首先使用爬虫工具采集新闻文章,并采取人工标注参考关键词构造出新闻文章数据集;然后对文本进行预处理,依存句法分析和过滤停用词;接着基于循环神经网络的顺序编码器和基于图卷积网络的图编码器分别获取文章的上下文语义和结构特征,并利用聚类方法将文本分为包含不同子主题部分,并利用多个基于注意力机制的解码器并行生成关键词;采样交叉熵损失进行模型参数优化;最后基于训练后的模型对待处理的新闻文章进行自动关键词生成。本发明通过句法结构信息弥补顺序编码存在的长距离单词依赖信息损失问题,从而提高生成关键词的质量。
-
公开(公告)号:CN114692604A
公开(公告)日:2022-07-01
申请号:CN202210398830.9
申请日:2022-04-16
Applicant: 东南大学
IPC: G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的方面级情感分类方法,具体如下,构筑方面级情感分类数据集;将数据集中的方面级特征嵌入到语义空间中;使用基于对抗BERT的编码器进行特征编码;基于线性变换的方面级句子特征压缩层对编码后的结果进行线性变换,使其满足胶囊网络计算的需要;基于胶囊网络的方面级句子特征提取层对压缩后的矩阵进一步的特征提取,捕获方面词与其对应上下文的语义关系;融标签正则化机制的情感分类层依据模型学习到的内容对文本进行方面级情感分类,可用于社交媒体文本的方面级情感分类,本发明基于对句子的方面级特征进行充分地学习,结合对抗训练机制将数据集的效果发挥到最大化,在复杂的场景下仍能表现出良好的效果,具有准确率高、鲁棒性好的特点。
-
公开(公告)号:CN114048309A
公开(公告)日:2022-02-15
申请号:CN202111365252.0
申请日:2021-11-17
Applicant: 东南大学
Abstract: 本发明公开了一种问题驱动的社交网络答案摘要自动生成方法,所述方法包括以下步骤:步骤1:社交网络文本采集;步骤2:数据预处理;步骤3:模型训练;步骤4:模型测试与文本生成,本发明能够改善传统摘要生成方法中过度依赖语义关联性而导致泛化能力低和缺乏可推理性等问题,进而提升生成摘要的可读性、流畅性和简洁性。
-
-
-