一种基于预训练的“提取-生成”式答案生成模型及方法

    公开(公告)号:CN117932066A

    公开(公告)日:2024-04-26

    申请号:CN202410072559.9

    申请日:2024-01-18

    Applicant: 东北大学

    Abstract: 本发明设计一种基于预训练的“提取‑生成”式答案生成模型及方法;所述模型包括数据预处理模块、信息提取模块和答案生成模块;数据预处理模块对输入的文本进行标记,把和答案相关的输入句子打上标签,形成一个二分类数据集;所述信息提取模块提取二分类数据集中与答案有关的句子,同时屏蔽掉文本中的无用信息;所述答案生成模块将信息提取模块的输出作为输入,然后得到最终输出即答案;针对开放性问题,提出了“提取‑生成”式两阶段答案生成模型;“提取”阶段,使用门控卷积神经网络提取与答案相关的信息,提升答案生成的精确性;“生成”阶段,将提取阶段作为输入,使用统一语言模型进行整理、去重,得到语义完整、语句通顺的长答案。

Patent Agency Ranking