-
公开(公告)号:CN115965027A
公开(公告)日:2023-04-14
申请号:CN202211724703.X
申请日:2022-12-30
Applicant: 南京邮电大学
IPC: G06F40/30 , G06F18/22 , G06N3/08 , G06N3/0464
Abstract: 一种基于语义匹配的文本摘要自动抽取方法,建立文本摘要抽取模型,抽取文本中的关键语句,利用贪心选择策略,构建候选摘要集,以候选摘要作为抽取单元;其次,对候选摘要集、原始文档和参考摘要文本序列,通过神经主题模型获取文本的主题表征,通过BERT预训练模型获取文本的语言表征;最后,使用语义匹配网络计算候选摘要与原始文档的语义相似度,在输出层中抽取出匹配度最佳的候选摘要。本方法能够利用文本之间的语义关系抽取原始文档中的关键内容,为解决抽取式文本摘要提供了一种可行的途径。
-
公开(公告)号:CN115659172A
公开(公告)日:2023-01-31
申请号:CN202211178863.9
申请日:2022-09-26
Applicant: 南京邮电大学
IPC: G06F18/214 , G06F18/25 , G06N3/04 , G06N3/08 , G06Q10/06
Abstract: 本发明提供一种基于关键信息掩码与拷贝的生成式文本摘要方法,通过获得原始文档的以词为单位的原始文本序列,以获取关键信息集合;获得输入文本序列;构建关键信息掩码语言模型,输入文本序列经由关键信息掩码语言模型后,获得掩码矩阵,得到训练集;构建生成式文本摘要模型,包括编码器、解码器和融合关键信息的BIOK拷贝机制,生成文本摘要;通过训练后的生成式文本摘要模型获得输入文档的文本摘要;本发明通过使用基于关键信息的掩码语言模型和BIOK拷贝机制,将使模型获得识别与总结关键信息的能力,能够减少生成文本中的集外词数量,并有效提升文本摘要的生成质量。
-
公开(公告)号:CN114358006B
公开(公告)日:2024-11-08
申请号:CN202210018039.0
申请日:2022-01-07
Applicant: 南京邮电大学
IPC: G06F40/289 , G06F16/28 , G06F40/216 , G06N3/0464 , G06N3/049 , G06N3/08 , G06F18/214
Abstract: 基于知识图谱的文本内容摘要生成方法,通过知识图谱技术,对篇幅较长的文本内容进行知识结点抽取和逻辑结构分析,采用图语义摘要技术,生成内容更加凝聚的文本内容摘要。该方法不仅可以用于单篇文章的内容生成,通过结合分类融合技术,还能实现多篇文章的内容摘要生成,可以实现针对某个自然资源的多方面内容的自动摘要整理工作。
-
公开(公告)号:CN114358006A
公开(公告)日:2022-04-15
申请号:CN202210018039.0
申请日:2022-01-07
Applicant: 南京邮电大学
IPC: G06F40/289 , G06F16/28 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 基于知识图谱的文本内容摘要生成方法,通过知识图谱技术,对篇幅较长的文本内容进行知识结点抽取和逻辑结构分析,采用图语义摘要技术,生成内容更加凝聚的文本内容摘要。该方法不仅可以用于单篇文章的内容生成,通过结合分类融合技术,还能实现多篇文章的内容摘要生成,可以实现针对某个自然资源的多方面内容的自动摘要整理工作。
-
-
-