-
公开(公告)号:CN118153566B
公开(公告)日:2024-07-19
申请号:CN202410566175.2
申请日:2024-05-09
Applicant: 华东交通大学
IPC: G06F40/279 , G06F40/216 , G06F16/35
Abstract: 本发明提供一种段落大意引导的汉语篇章结构分析方法,应用于段落大意引导的汉语篇章结构分析模型,该模型包括融合词信息的字级编码模块,文本块级稀疏Transformer编码模块、基于指针网络的解码模块、基本文本摘要语料的预训练模块和基于篇章语料的训练模块。本发明充分利用了汉语篇章结构的特性,实质性地提高了汉语篇章结构分析的性能,具有较强的实用价值,该方法为端到端的自顶向下分析方法,不需要以切分好的基本篇章单元作为输入,有效地避免了错误传播问题,提高了方法的适用性;本发明能较好地学习输入文本的段落大意,并把这种全局信息和段落中文本块的表示等局部信息有效融合,以引导整个篇章结构树的构建,达到提高分析性能的目的。
-
公开(公告)号:CN118153566A
公开(公告)日:2024-06-07
申请号:CN202410566175.2
申请日:2024-05-09
Applicant: 华东交通大学
IPC: G06F40/279 , G06F40/216 , G06F16/35
Abstract: 本发明提供一种段落大意引导的汉语篇章结构分析方法,应用于段落大意引导的汉语篇章结构分析模型,该模型包括融合词信息的字级编码模块,文本块级稀疏Transformer编码模块、基于指针网络的解码模块、基本文本摘要语料的预训练模块和基于篇章语料的训练模块。本发明充分利用了汉语篇章结构的特性,实质性地提高了汉语篇章结构分析的性能,具有较强的实用价值,该方法为端到端的自顶向下分析方法,不需要以切分好的基本篇章单元作为输入,有效地避免了错误传播问题,提高了方法的适用性;本发明能较好地学习输入文本的段落大意,并把这种全局信息和段落中文本块的表示等局部信息有效融合,以引导整个篇章结构树的构建,达到提高分析性能的目的。
-
公开(公告)号:CN118095250A
公开(公告)日:2024-05-28
申请号:CN202410488368.0
申请日:2024-04-23
Applicant: 华东交通大学
IPC: G06F40/205 , G06N3/08 , G06N3/0455 , G06F40/30 , G06N5/025
Abstract: 本发明提供一种细分领域增强的隐式篇章关系识别方法,应用于隐式篇章关系识别模型,所述隐式篇章关系识别模型包括基础编码模块、多个细分领域编码模块、综合领域编码及分类模块、细分领域训练模块和综合领域训练模块,对于来自不同细分领域的实例,模型能够基于多级增强层自动选择相应细分领域的知识,有利于提升识别的性能;本发明使用多个细分领域编码模块可以更好地保存各细分领域的知识,以避免集成到同一模块中可能造成的知识遗忘问题,各细分领域编码模块可以单独训练,在所含细分领域发生变化时,重新训练模型的代价较小。
-
公开(公告)号:CN118095250B
公开(公告)日:2024-06-28
申请号:CN202410488368.0
申请日:2024-04-23
Applicant: 华东交通大学
IPC: G06F40/205 , G06N3/08 , G06N3/0455 , G06F40/30 , G06N5/025
Abstract: 本发明提供一种细分领域增强的隐式篇章关系识别方法,应用于隐式篇章关系识别模型,所述隐式篇章关系识别模型包括基础编码模块、多个细分领域编码模块、综合领域编码及分类模块、细分领域训练模块和综合领域训练模块,对于来自不同细分领域的实例,模型能够基于多级增强层自动选择相应细分领域的知识,有利于提升识别的性能;本发明使用多个细分领域编码模块可以更好地保存各细分领域的知识,以避免集成到同一模块中可能造成的知识遗忘问题,各细分领域编码模块可以单独训练,在所含细分领域发生变化时,重新训练模型的代价较小。
-
公开(公告)号:CN118013962B
公开(公告)日:2024-06-21
申请号:CN202410417577.6
申请日:2024-04-09
Applicant: 华东交通大学
IPC: G06F40/284 , G06F40/30 , G06F40/289 , G06N3/0442
Abstract: 本发明提供一种基于双向序列生成的汉语篇章连接词识别方法,通过句子预处理及编码模块学习候选篇章连接词的初始语义向量表示,基于Longformer的段落编码模块通过全局注意力机制和局部注意力机制引入段落级别的上下文信息,计算候选篇章连接词的最终语义向量表示,基于双向序列生成的预测模块包括正向生成层和反向生成层,分别使用两个长短时记忆网络从左至右和从右至左预测篇章连接词序列,实现篇章连接词的识别,此外,通过后处理模块处理复合连接词的识别问题,并通过互学习代价增强的训练模块使正向生成层和反向生成层能相互学习,提升识别的性能,本发明能够充分捕获篇章连接词之间双向长距离的依赖关系,显著地提高汉语篇章连接词识别的性能。
-
公开(公告)号:CN118013962A
公开(公告)日:2024-05-10
申请号:CN202410417577.6
申请日:2024-04-09
Applicant: 华东交通大学
IPC: G06F40/284 , G06F40/30 , G06F40/289 , G06N3/0442
Abstract: 本发明提供一种基于双向序列生成的汉语篇章连接词识别方法,通过句子预处理及编码模块学习候选篇章连接词的初始语义向量表示,基于Longformer的段落编码模块通过全局注意力机制和局部注意力机制引入段落级别的上下文信息,计算候选篇章连接词的最终语义向量表示,基于双向序列生成的预测模块包括正向生成层和反向生成层,分别使用两个长短时记忆网络从左至右和从右至左预测篇章连接词序列,实现篇章连接词的识别,此外,通过后处理模块处理复合连接词的识别问题,并通过互学习代价增强的训练模块使正向生成层和反向生成层能相互学习,提升识别的性能,本发明能够充分捕获篇章连接词之间双向长距离的依赖关系,显著地提高汉语篇章连接词识别的性能。
-
-
-
-
-