基于预训练语言模型的抑郁症访谈对话生成方法

    公开(公告)号:CN113780012B

    公开(公告)日:2023-12-29

    申请号:CN202111165245.6

    申请日:2021-09-30

    Applicant: 东南大学

    Abstract: 本发明公开了基于预训练语言模型的抑郁症访谈对话生成方法,包括通过固定问题采集用户的基本信息;按策略抽取预设问题库中的部分问题,构建向用户提问的主问题流;对用户回复进行情绪极性分类,并选取相应回复句作为对用户情绪的响应;使用微调后的预训练语言模型GPT‑2,根据当前问题和用户回复,生成与用户回复相关的后续问题。本发明的系统主要包括:语音识别与合成模块、预设问题库、主问题流构建模块、情绪分类与响应模块和后续问题生成模块。本发明相较于之前完全使用固定模板的对话生成方法,微调后的预训练语言模型能生成更灵活的后续问题,可以进行更有效的抑郁诊断访谈,因而具有更好的效果。

    一种基于分层特征解耦的NL2SQL方法和系统

    公开(公告)号:CN116776893A

    公开(公告)日:2023-09-19

    申请号:CN202310784012.7

    申请日:2023-06-29

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于分层特征解耦的NL2SQL方法和系统,首先构建形如(查询问题的自然语言描述,SQL查询语句,对应的数据库模式)的三元组组成的NL2SQL数据集;再构建NL2SQL模型,所述NL2SQL模型由输入模块、语义表示模块、子句特征解耦模块、子任务特征解耦模块、子任务预测模块和SQL查询语句输出模块组成,依次构建上述模块,实现NL2SQL任务;最后设置训练参数、构造损失函数,对NL2SQL模型进行训练,实现NL2SQL任务。

    基于反模版解耦的无监督意见摘要生成方法及系统

    公开(公告)号:CN116775859A

    公开(公告)日:2023-09-19

    申请号:CN202310784055.5

    申请日:2023-06-29

    Applicant: 东南大学

    Inventor: 周德宇 张言越

    Abstract: 本发明公开了一种基于反模版解耦的无监督意见摘要生成方法及系统,首先构建并训练意见摘要的反模板生成模型,利用对比学习和变分自编码器,将意见作为监督信号,得到意见的表示,取若干意见表示的平均进行解码,初步得到意见的反模版;再构建解耦文本表示意见摘要生成模型,将意见摘要的表示解耦成内容、模板两部分,得到内容的表示向量;最后训练无监督的意见摘要模型,将内容表示向量输入无监督的意见摘要模型的解码器中,通过解码器重构原始文本,完成意见摘要的生成。本方法通过在文本信息中训练生成文本表示的“反模版”表示,利用正交解耦的方式来去除文本表示中的模版信息,从而减少冗余信息,摘要生成更加准确,工作效率更高。

    一种面向新闻文本的基于深度聚类模型的事件线抽取方法

    公开(公告)号:CN111125520B

    公开(公告)日:2023-04-21

    申请号:CN201911270225.8

    申请日:2019-12-11

    Applicant: 东南大学

    Abstract: 本发明公开了一种面向新闻文本的基于深度聚类模型的事件线抽取方法,包括:新闻文本预处理;文本的初始隐事件表示预训练;按照发布时间对语料中新闻文本进行分组;基于深度聚类模型确定各组中每条新闻所属的事件线;对各组中事件线编号相同的事件元素进行后处理,得到事件的结构化展示;对各组抽取出的具有相同事件线编号的事件进行后处理得到事件线。本发明采用神经网络模型自动抽取文本中隐含的事件特征,避免了手动选取和构建特征,并且抽取得到的文本的隐含事件特征能够为下游应用提供支持;能够同时进行事件特征抽取和事件线提取,减少了误差传播的可能性。相比于以往的事件线抽取方法,本发明具有更高的抽取准确率与召回率。

    一种基于社交媒体内容和结构的用户实时观点检测方法

    公开(公告)号:CN110059190A

    公开(公告)日:2019-07-26

    申请号:CN201910312836.8

    申请日:2019-04-18

    Applicant: 东南大学

    Inventor: 周德宇 朱力行

    Abstract: 本发明公开了一种基于社交媒体内容和结构的用户实时观点检测方法,该方法主要包括:基于微博API和哈希标签实时地爬取事件相关的微博以及微博作者的社交网络信息;基于微博文本和用户的社交网络信息,利用哈希标签和远程监督技术生成训练数据;基于动态神经网络模型训练,完成用户级别的动态观点检测。本发明不需要大量标注语料,可以预测用户在下个时间段的关于某一主题的立场,得益于循环神经网络对用户行为的模拟,有着更高的准确率;可以在用户语料缺失的情况下利用社交网络信息预测用户观点;可以在获得新的微博数据,动态地在已训练好的动态神经网络上进行迭代,避免了从头开始训练费时的问题。

    一种引入类信息的文本生成图像方法及装置

    公开(公告)号:CN112765317B

    公开(公告)日:2025-01-24

    申请号:CN202110071013.8

    申请日:2021-01-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种引入类信息的文本生成图像方法及装置,其中引入类信息的文本生成图像方法包括训练阶段和测试阶段,训练阶段基于生成对抗网络,利用描述图像的自然语言文本,该文本的类标签以及对应的真实图像训练生成器以及判别器;测试阶段利用文本及其类标签在生成器中生成对应图像,本发明的有益效果为:根据文本信息编码和类信息编码,通过分别转码生成文本语义图像特征和类信息图像特征,之后融合两种级别的图像特征解码生成图像,在生成图像的过程中引入了对应的类信息来加强生成图像和文本的相关性,同时在训练过程中通过多阶段的生成过程,逐步生成更高分辨率的图像,降低了直接生成高分辨率图像的训练难度。

    基于三阶段的小样本嵌套命名实体识别方法和系统

    公开(公告)号:CN116776885A

    公开(公告)日:2023-09-19

    申请号:CN202310784041.3

    申请日:2023-06-29

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于三阶段的小样本嵌套命名实体识别方法和系统,首先根据原始嵌套NER数据集采样,保证每种类别采样得到的实体数量一致,初步构建嵌套NER小样本数据集;再从原始嵌套NER数据集的训练集、验证集以及测试集中分别采样K个实体实例,得到嵌套NER小样本训练数据集、验证集以及测试集;再构建嵌套NER模型,分别构建实体定位子模型、实体抽取子模型以及实体分类子模型,捕捉内层实体和外层实体的嵌套关系,构建特殊的软提示模板;最后训练嵌套NER模型,更好的支持小样本场景下的模型训练。

    一种基于真空度引导的汽轮机输出功率预测方法

    公开(公告)号:CN115455698A

    公开(公告)日:2022-12-09

    申请号:CN202211121409.X

    申请日:2022-09-15

    Abstract: 一种基于真空度引导的汽轮机输出功率预测方法,包括:采集汽轮机和凝汽器原始数据,并划分成历史数据序列、被预测节点的汽轮机数据和凝汽器数据;采用编码器‑解码器框架,并额外提出一个连接模块;在编码器中采用LSTM网络编码凝汽器工况信息并预测真空度,并将真空度的信息编码到隐状态表示中;在连接模块,通过注意机制和CNN分别捕捉编码器局部和全局真空信息;在解码器中,将编码器包含的真空度信息隐状态和细胞状态用于初始化,并将局部、全局真空信息、汽轮机的工况信息作为解码器的输入进行编码并预测汽轮机输出功率,直至MSE损失函数收敛,完成网络训练。通过训练好的网络对汽轮机输出功率进行预测。

Patent Agency Ranking