-
公开(公告)号:CN113780012B
公开(公告)日:2023-12-29
申请号:CN202111165245.6
申请日:2021-09-30
Applicant: 东南大学
IPC: G06F16/332 , G06F16/35 , G06F18/2415 , G06N3/0442 , G06N3/0455 , G06N3/084 , G16H20/70 , G06F40/35
Abstract: 本发明公开了基于预训练语言模型的抑郁症访谈对话生成方法,包括通过固定问题采集用户的基本信息;按策略抽取预设问题库中的部分问题,构建向用户提问的主问题流;对用户回复进行情绪极性分类,并选取相应回复句作为对用户情绪的响应;使用微调后的预训练语言模型GPT‑2,根据当前问题和用户回复,生成与用户回复相关的后续问题。本发明的系统主要包括:语音识别与合成模块、预设问题库、主问题流构建模块、情绪分类与响应模块和后续问题生成模块。本发明相较于之前完全使用固定模板的对话生成方法,微调后的预训练语言模型能生成更灵活的后续问题,可以进行更有效的抑郁诊断访谈,因而具有更好的效果。
-
公开(公告)号:CN116776893A
公开(公告)日:2023-09-19
申请号:CN202310784012.7
申请日:2023-06-29
Applicant: 东南大学
IPC: G06F40/30 , G06F16/242 , G06F16/2452 , G06N3/042 , G06N3/047 , G06N3/048 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于分层特征解耦的NL2SQL方法和系统,首先构建形如(查询问题的自然语言描述,SQL查询语句,对应的数据库模式)的三元组组成的NL2SQL数据集;再构建NL2SQL模型,所述NL2SQL模型由输入模块、语义表示模块、子句特征解耦模块、子任务特征解耦模块、子任务预测模块和SQL查询语句输出模块组成,依次构建上述模块,实现NL2SQL任务;最后设置训练参数、构造损失函数,对NL2SQL模型进行训练,实现NL2SQL任务。
-
公开(公告)号:CN116775859A
公开(公告)日:2023-09-19
申请号:CN202310784055.5
申请日:2023-06-29
Applicant: 东南大学
IPC: G06F16/34 , G06F40/186 , G06N3/0895 , G06N3/088 , G06N3/0442 , G06N3/0455
Abstract: 本发明公开了一种基于反模版解耦的无监督意见摘要生成方法及系统,首先构建并训练意见摘要的反模板生成模型,利用对比学习和变分自编码器,将意见作为监督信号,得到意见的表示,取若干意见表示的平均进行解码,初步得到意见的反模版;再构建解耦文本表示意见摘要生成模型,将意见摘要的表示解耦成内容、模板两部分,得到内容的表示向量;最后训练无监督的意见摘要模型,将内容表示向量输入无监督的意见摘要模型的解码器中,通过解码器重构原始文本,完成意见摘要的生成。本方法通过在文本信息中训练生成文本表示的“反模版”表示,利用正交解耦的方式来去除文本表示中的模版信息,从而减少冗余信息,摘要生成更加准确,工作效率更高。
-
公开(公告)号:CN111125520B
公开(公告)日:2023-04-21
申请号:CN201911270225.8
申请日:2019-12-11
Applicant: 东南大学
IPC: G06F16/9535 , G06F40/295
Abstract: 本发明公开了一种面向新闻文本的基于深度聚类模型的事件线抽取方法,包括:新闻文本预处理;文本的初始隐事件表示预训练;按照发布时间对语料中新闻文本进行分组;基于深度聚类模型确定各组中每条新闻所属的事件线;对各组中事件线编号相同的事件元素进行后处理,得到事件的结构化展示;对各组抽取出的具有相同事件线编号的事件进行后处理得到事件线。本发明采用神经网络模型自动抽取文本中隐含的事件特征,避免了手动选取和构建特征,并且抽取得到的文本的隐含事件特征能够为下游应用提供支持;能够同时进行事件特征抽取和事件线提取,减少了误差传播的可能性。相比于以往的事件线抽取方法,本发明具有更高的抽取准确率与召回率。
-
公开(公告)号:CN114819354A
公开(公告)日:2022-07-29
申请号:CN202210464493.9
申请日:2022-04-29
Applicant: 江苏方天电力技术有限公司 , 东南大学
Abstract: 本发明公开了一种基于残差记忆网络的凝汽器真空度预测方法,包括:采集凝汽器相关的原始数据,对每一组原始数据划分成历史数据序列、被预测节点工况数据和被预测节点凝汽器真空度数据;利用长短时记忆网络将历史数据编码存入端到端残差记忆网络的记忆池中,将被预测节点工况数据编码作为端到端残差记忆网络的输入,将被预测节点凝汽器真空度数据作为端到端残差记忆网络的目标输出,训练端到端残差记忆网络,直至MSE损失函数收敛,完成对端到端残差记忆网络的训练;实时采集凝汽器相关的原始数据,输入训练好的端到端残差记忆网络中,预测出凝汽器真空度。本发明方法能够捕获历史数据中隐含的周期性特征、时序特征,具有更高的预测精度和稳定性。
-
公开(公告)号:CN110059190A
公开(公告)日:2019-07-26
申请号:CN201910312836.8
申请日:2019-04-18
Applicant: 东南大学
Abstract: 本发明公开了一种基于社交媒体内容和结构的用户实时观点检测方法,该方法主要包括:基于微博API和哈希标签实时地爬取事件相关的微博以及微博作者的社交网络信息;基于微博文本和用户的社交网络信息,利用哈希标签和远程监督技术生成训练数据;基于动态神经网络模型训练,完成用户级别的动态观点检测。本发明不需要大量标注语料,可以预测用户在下个时间段的关于某一主题的立场,得益于循环神经网络对用户行为的模拟,有着更高的准确率;可以在用户语料缺失的情况下利用社交网络信息预测用户观点;可以在获得新的微博数据,动态地在已训练好的动态神经网络上进行迭代,避免了从头开始训练费时的问题。
-
公开(公告)号:CN112765317B
公开(公告)日:2025-01-24
申请号:CN202110071013.8
申请日:2021-01-19
Applicant: 东南大学
IPC: G06T11/00 , G06F16/334 , G06F16/58 , G06F40/289 , G06F40/30 , G06N3/0464 , G06N3/08 , G06T3/4053
Abstract: 本发明公开了一种引入类信息的文本生成图像方法及装置,其中引入类信息的文本生成图像方法包括训练阶段和测试阶段,训练阶段基于生成对抗网络,利用描述图像的自然语言文本,该文本的类标签以及对应的真实图像训练生成器以及判别器;测试阶段利用文本及其类标签在生成器中生成对应图像,本发明的有益效果为:根据文本信息编码和类信息编码,通过分别转码生成文本语义图像特征和类信息图像特征,之后融合两种级别的图像特征解码生成图像,在生成图像的过程中引入了对应的类信息来加强生成图像和文本的相关性,同时在训练过程中通过多阶段的生成过程,逐步生成更高分辨率的图像,降低了直接生成高分辨率图像的训练难度。
-
公开(公告)号:CN114942937B
公开(公告)日:2024-07-19
申请号:CN202210403424.7
申请日:2022-04-18
Applicant: 江苏方天电力技术有限公司 , 东南大学
IPC: G06F16/242 , G06F16/2458 , G06F8/30
Abstract: 本发明公开了基于限制性约束的带噪NL2SQL方法和装置,包括以下步骤:(1)NL2SQL知识库构建步骤,构造由查询问题、SQL查询语句以及表结构一一对应的数据条目,初步构建知识库;(2)带噪NL2SQL数据集构建步骤,用于根据NL2SQL知识库划分训练集、验证集以及测试集,人工引入噪声标签,构建带噪NL2SQL数据集;(3)带噪NL2SQL模型构建步骤,用于分别构建带噪子任务编码模型、无噪子任务编码模型;为了消除带噪子任务对其他任务的影响,构建限定性约束的方法缓解噪声对模型的影响;(4)带噪NL2SQL模型训练步骤,用于构建损失函数,构建优化函数。本发明的模型和最近一些先进的方法进行了比较,实验结果显示本发明的方法较之有了很大的提升。
-
公开(公告)号:CN116776885A
公开(公告)日:2023-09-19
申请号:CN202310784041.3
申请日:2023-06-29
Applicant: 东南大学
IPC: G06F40/295 , G06F16/35 , G06F18/214 , G06F18/241 , G06N3/0499 , G06N3/08 , G06N3/047
Abstract: 本发明公开了一种基于三阶段的小样本嵌套命名实体识别方法和系统,首先根据原始嵌套NER数据集采样,保证每种类别采样得到的实体数量一致,初步构建嵌套NER小样本数据集;再从原始嵌套NER数据集的训练集、验证集以及测试集中分别采样K个实体实例,得到嵌套NER小样本训练数据集、验证集以及测试集;再构建嵌套NER模型,分别构建实体定位子模型、实体抽取子模型以及实体分类子模型,捕捉内层实体和外层实体的嵌套关系,构建特殊的软提示模板;最后训练嵌套NER模型,更好的支持小样本场景下的模型训练。
-
公开(公告)号:CN115455698A
公开(公告)日:2022-12-09
申请号:CN202211121409.X
申请日:2022-09-15
Applicant: 江苏方天电力技术有限公司 , 东南大学
Abstract: 一种基于真空度引导的汽轮机输出功率预测方法,包括:采集汽轮机和凝汽器原始数据,并划分成历史数据序列、被预测节点的汽轮机数据和凝汽器数据;采用编码器‑解码器框架,并额外提出一个连接模块;在编码器中采用LSTM网络编码凝汽器工况信息并预测真空度,并将真空度的信息编码到隐状态表示中;在连接模块,通过注意机制和CNN分别捕捉编码器局部和全局真空信息;在解码器中,将编码器包含的真空度信息隐状态和细胞状态用于初始化,并将局部、全局真空信息、汽轮机的工况信息作为解码器的输入进行编码并预测汽轮机输出功率,直至MSE损失函数收敛,完成网络训练。通过训练好的网络对汽轮机输出功率进行预测。
-
-
-
-
-
-
-
-
-