一种面向新闻文本的基于深度聚类模型的事件线抽取方法

    公开(公告)号:CN111125520A

    公开(公告)日:2020-05-08

    申请号:CN201911270225.8

    申请日:2019-12-11

    Applicant: 东南大学

    Abstract: 本发明公开了一种面向新闻文本的基于深度聚类模型的事件线抽取方法,包括:新闻文本预处理;文本的初始隐事件表示预训练;按照发布时间对语料中新闻文本进行分组;基于深度聚类模型确定各组中每条新闻所属的事件线;对各组中事件线编号相同的事件元素进行后处理,得到事件的结构化展示;对各组抽取出的具有相同事件线编号的事件进行后处理得到事件线。本发明采用神经网络模型自动抽取文本中隐含的事件特征,避免了手动选取和构建特征,并且抽取得到的文本的隐含事件特征能够为下游应用提供支持;能够同时进行事件特征抽取和事件线提取,减少了误差传播的可能性。相比于以往的事件线抽取方法,本发明具有更高的抽取准确率与召回率。

    一种基于纠错输出编码的无需消歧的无监督词性标注方法

    公开(公告)号:CN105955955B

    公开(公告)日:2018-08-28

    申请号:CN201610292680.8

    申请日:2016-05-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于纠错输出编码的无需消歧的无监督词性标注方法,包括两个主要步骤:(1)基于词性字典生成训练数据。(2)基于纠错输出编码进行训练与测试。本发明不需标注语料,可以应用于不易获得标注语料的语言的词性标注问题;不需消歧,避免了迭代式消歧过程中的错误传播问题;采用神经语言模型自动生成训练和测试使用的特征,避免了手动选取和构建特征。

    一种基于深度交互推理模型的事实检测方法

    公开(公告)号:CN113837384B

    公开(公告)日:2025-01-21

    申请号:CN202110955878.0

    申请日:2021-08-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度交互推理模型的事实检测方法,包括:使用BERT模型对证据和陈述分别进行编码;通过多头映射机制抽取证据的语义信息,并将其保存到记忆池中;计算陈述与每条证据之间的语义关系;基于注意力机制获取证据集合的整体表示,并计算陈述和证据整体表示之间的推理关系;将推理结构升级为多层结构,对推理关系进行迭代式地更新;利用更新后的证据表示对陈述的真实性进行判断。本发明方法中的多头映射机制能够从不同角度抽取证据的语义信息;记忆池结构赋予模型处理“多跳”问题的能力;多层推理结构能够深层次挖掘证据和陈述之间的推理关系。相比于其他方法,本发明方法在UKP‑Snopes数据集上具有更好的预测效果。

    一种引入胶囊网络的文本生成图像方法及装置

    公开(公告)号:CN112765316B

    公开(公告)日:2024-08-02

    申请号:CN202110069525.0

    申请日:2021-01-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种引入胶囊网络的文本生成图像方法及装置,包括训练阶段和测试阶段,训练阶段通过文本信息,类标签和真实图像来训练一个引入胶囊网络的图像生成模型,包括多阶段的图像生成器和对生成图像评分的图像判别器,测试阶段输入文本及其类标签,利用图像生成器生成对应的图片,在文本生成图像的过程中引入了胶囊网络,同时学习自然语言文本和对应类标签中的实体信息,加强生成图像和文本的相关性。本发明的有益效果为:通过胶囊网络加强了对实体信息的学习,通过在较低维度的隐空间对文本信息和类信息进行融合,降低了训练的参数量,加强了文本和类信息的交互,在训练过程中通过多阶段的生成过程,降低了直接生成高分辨率图像的训练难度。

    基于对抗性框架的无监督意见摘要生成方法及系统

    公开(公告)号:CN116775860A

    公开(公告)日:2023-09-19

    申请号:CN202310784057.4

    申请日:2023-06-29

    Applicant: 东南大学

    Inventor: 周德宇 张言越

    Abstract: 本发明公开了一种基于对抗性框架的无监督意见摘要生成方法及系统,首先构建数据集,在数据库中选取待测数据,对数据进行预处理,划分用于验证和测试的数据,构建无监督意见摘要数据集;再构建M2A模型,选择两个生成摘要模型分别作为摘要生成器体现M2A的模型无关性,基于自然语言推理的方法构建模型的摘要判别器;然后先训练摘要判别器,再整体训练M2A模型,构建损失函数,构建优化器;最后通过评价指标对M2A模型进行评价。本发明在生成意见摘要的类别准确性和情感准确性上效果显著提升,摘要生成的工作效率大大提高。

    一种面向机场应急预案文本的实体与关系联合抽取方法

    公开(公告)号:CN113051891B

    公开(公告)日:2022-11-18

    申请号:CN202110040698.X

    申请日:2021-01-13

    Applicant: 东南大学

    Inventor: 周德宇 袁佳乐

    Abstract: 本发明公开了一种面向机场应急预案文本的实体与关系联合抽取方法,实现对机场应急预案文本的实体识别与实体关系抽取,主要包括以下步骤:机场应急预案文本过滤筛选;使用特征编码器编码机场应急预案文本句子,获得句子中单词的特征向量表示;基于句子中单词特征向量识别句子中主体实体;构建主体实体与句子中单词的注意力权重,拼接单词加权特征向量并与原始特征向量;依据拼接后的单词特征向量识别句子在每一关系类型下的客体实体,组建关系三元组,本发明实现机场应急预案文本的实体识别与实体关系抽取,考虑主体实体与句子中单词的关联,计算实体‑单词注意力权重,关注句子中与主体实体更相关的单词,进而提高实体关系抽取的准确率。

    基于预训练语言模型的抑郁症访谈对话生成方法

    公开(公告)号:CN113780012A

    公开(公告)日:2021-12-10

    申请号:CN202111165245.6

    申请日:2021-09-30

    Applicant: 东南大学

    Abstract: 本发明公开了基于预训练语言模型的抑郁症访谈对话生成方法,包括通过固定问题采集用户的基本信息;按策略抽取预设问题库中的部分问题,构建向用户提问的主问题流;对用户回复进行情绪极性分类,并选取相应回复句作为对用户情绪的响应;使用微调后的预训练语言模型GPT‑2,根据当前问题和用户回复,生成与用户回复相关的后续问题。本发明的系统主要包括:语音识别与合成模块、预设问题库、主问题流构建模块、情绪分类与响应模块和后续问题生成模块。本发明相较于之前完全使用固定模板的对话生成方法,微调后的预训练语言模型能生成更灵活的后续问题,可以进行更有效的抑郁诊断访谈,因而具有更好的效果。

Patent Agency Ranking