-
公开(公告)号:CN110929024A
公开(公告)日:2020-03-27
申请号:CN201911262119.5
申请日:2019-12-10
Applicant: 哈尔滨工业大学
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 一种基于多模型融合的抽取式文本摘要生成方法,本发明涉及抽取式文本摘要生成方法。本发明的目的是为了解决现有的单一的抽取式模型无法学习到摘要文本的全部重要信息,导致摘要抽取准确率及召回率低的问题。过程为:一、将每个句子的词向量输入双向双层LSTM,输出全文中的每一个句子的特征表示;二、将句子的特征表示按文章顺序输入双向双层LSTM,输出隐层序列,并利用最大池化层得到池化后的向量作为全文的特征表示;三、构建序列预测模型架构;四、构建分段联合序列预测摘要模型;五、构建编码器解码器模型;六、构建加入强化学习机制的编码器解码器联合训练模型;七、使用模型融合方法生成文本摘要。本发明用于抽取式文本摘要领域。
-
公开(公告)号:CN112148863B
公开(公告)日:2022-07-01
申请号:CN202011104023.9
申请日:2020-10-15
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F40/295 , G06N3/04
Abstract: 一种融入常识知识的生成式对话摘要方法,属于自然语言处理领域。本发明解决了现有生成式对话摘要方法未利用常识知识而导致生成的对话摘要不准确,抽象性低的问题。本发明方法包括:获取常识知识库ConceptNet与对话摘要数据集SAMSum;利用获取的常识知识库ConceptNet为对话摘要数据集SAMSum引入元组知识,构建异构对话图;练步骤三中构造的对话异构神经网络模型,通过训练的对话异构神经网络模型从一段对话中生成最终对话摘要。本发明应用于对话摘要的生成。
-
公开(公告)号:CN110516213B
公开(公告)日:2022-04-15
申请号:CN201910828514.9
申请日:2019-09-03
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/166 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 一种基于表格层次化建模的结构化数据生成文本方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决现有结构化数据生成文本只利用了数据本身单一信息,无法衡量实体数据整体情况以及同类型数据的表现差异和多表格数据之间的利用不充分问题。一、将数据集的记录用三元组表示,分别对每条记录所属的行、列维度建模得到该记录的行向量、列向量,并引入时间轴,对不同日期的同类型数据建模得到该记录的时间向量;二、融合行向量、列向量和时间向量得到该记录新的向量表示;三、对每行记录的新向量进行均值池化得到新行向量;四、每个解码时刻,对三得到的向量进行解码,得到当前时刻每条记录的权重。本发明用于表格数据生成文本方法。
-
公开(公告)号:CN111460132B
公开(公告)日:2021-08-10
申请号:CN202010163281.8
申请日:2020-03-10
Applicant: 哈尔滨工业大学
Abstract: 一种基于图卷积神经网络的生成式会议摘要方法,本发明涉及基于图卷积神经网络的生成式会议摘要方法。本发明的目的是为了解决现有方法仅仅使用句子和词语的序列结构建模会议文本,忽略了会议丰富的对话篇章结构信息的问题。过程为:一:得到会议的对话篇章结构;二:构建会议篇章结构图,以及会议中句子之间的对话篇章结构;三:构建伪数据和对应的伪数据的会议篇章结构图;四:得到预训练好的图神经网络的生成式会议摘要模型和初始化参数;得到训练好的图神经网络的生成式会议摘要模型和模型参数;利用训练好的图神经网络的生成式会议摘要模型对待测试的会议进行测试,生成摘要。本发明用于自然语言处理领域下的生成式会议摘要方法。
-
公开(公告)号:CN111460132A
公开(公告)日:2020-07-28
申请号:CN202010163281.8
申请日:2020-03-10
Applicant: 哈尔滨工业大学
Abstract: 一种基于图卷积神经网络的生成式会议摘要方法,本发明涉及基于图卷积神经网络的生成式会议摘要方法。本发明的目的是为了解决现有方法仅仅使用句子和词语的序列结构建模会议文本,忽略了会议丰富的对话篇章结构信息的问题。过程为:一:得到会议的对话篇章结构;二:构建会议篇章结构图,以及会议中句子之间的对话篇章结构;三:构建伪数据和对应的伪数据的会议篇章结构图;四:得到预训练好的图神经网络的生成式会议摘要模型和初始化参数;得到训练好的图神经网络的生成式会议摘要模型和模型参数;利用训练好的图神经网络的生成式会议摘要模型对待测试的会议进行测试,生成摘要。本发明用于自然语言处理领域下的生成式会议摘要方法。
-
公开(公告)号:CN110738026A
公开(公告)日:2020-01-31
申请号:CN201911012473.2
申请日:2019-10-23
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F40/166 , G06F40/126 , G06F40/289 , G06N3/04
Abstract: 本文描述了一种用于生成描述文本的方法和设备。所述方法包括:将关键词序列以及具有预定风格的参考文本输入经训练的神经网络,其中所述神经网络包括关键词编码器、文本编码器、互注意力编码器以及解码器;利用关键词编码器对关键词序列进行编码以得到关键词序列的隐层状态序列;利用文本编码器对参考文本进行编码以得到参考文本的隐层状态序列;利用互注意力编码器对关键词序列的隐层状态序列和参考文本的隐层状态序列进行编码以得到融合了预定风格的关键词序列的隐层状态序列;利用解码器对融合了预定风格的关键词序列的隐层状态序列进行解码以输出具有所述预定风格的描述文本。
-
公开(公告)号:CN111400489B
公开(公告)日:2022-12-02
申请号:CN202010269479.4
申请日:2020-04-08
Applicant: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC: G06F16/34
Abstract: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
公开(公告)号:CN113204627B
公开(公告)日:2022-08-23
申请号:CN202110522932.2
申请日:2021-05-13
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/34
Abstract: 利用DialoGPT作为特征标注器的对话摘要生成系统,本发明涉及对话摘要生成系统。本发明是为了解决现有对话摘要生成方法对话摘要获取耗时耗力,效率差,准确率低的问题。系统包括:所述数据采集模块用于获取数据集;所述对话预训练模块用于获取DialoGPT;所述对话预处理模块将对话处理为上下文回复对以及对话序列;所述预测损失及对话上下文的表示模块用于得到预测损失以及对话上下文的表示形式;所述标注模块用于标记对话;所述摘要生成模块生成目标摘要;当生成的目标摘要符合要求,则将待处理数据集经过处理,处理后输入摘要生成器生成待处理数据集的目标摘要。本发明用于自然语言处理领域。
-
公开(公告)号:CN111310927B
公开(公告)日:2022-04-15
申请号:CN202010061962.3
申请日:2020-01-19
Applicant: 哈尔滨工业大学
Abstract: 一种引入推理机制的文本生成方法,本发明涉及文本生成方法。本发明的目的是为了解决现有数据生成文本中数据信息推理表格信息中隐含信息准确率低的问题。过程为:一、用#号替换表格数据信息对应的新闻报告中能推理的数字;二、得到同一实体的总体表示;三、采用解码器LSTM对得到的同一实体的总体表示进行解码,生成每个三元组的权重;解码器根据三元组权重生成具体的文字;若生成的文字是#号,触发推理按钮,生成计算序列,将计算序列得到的结果返回触发推理按钮位置,替换#号,解码器继续依次生成文字,直到文字生成了EOS结束标识,文字生成结束;得到神经网络网格推理模型。本发明用于NLP领域数据到文本领域。
-
公开(公告)号:CN113204627A
公开(公告)日:2021-08-03
申请号:CN202110522932.2
申请日:2021-05-13
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/34
Abstract: 利用DialoGPT作为特征标注器的对话摘要生成系统,本发明涉及对话摘要生成系统。本发明是为了解决现有对话摘要生成方法对话摘要获取耗时耗力,效率差,准确率低的问题。系统包括:所述数据采集模块用于获取数据集;所述对话预训练模块用于获取DialoGPT;所述对话预处理模块将对话处理为上下文回复对以及对话序列;所述预测损失及对话上下文的表示模块用于得到预测损失以及对话上下文的表示形式;所述标注模块用于标记对话;所述摘要生成模块生成目标摘要;当生成的目标摘要符合要求,则将待处理数据集经过处理,处理后输入摘要生成器生成待处理数据集的目标摘要。本发明用于自然语言处理领域。
-
-
-
-
-
-
-
-
-