-
公开(公告)号:CN114781376A
公开(公告)日:2022-07-22
申请号:CN202210589669.3
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F40/289 , G06F40/211 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 一种基于深度学习的新闻文本摘要生成方法,包括以下步骤:1)爬取新闻标题和新闻文本,获得原始数据;2)对数据进行预处理,获得模型所需的数据格式;3)利用Bert模型作为核心来构建抽取式和生成式的摘要生成系统;4)抽取式模型先对输入文本抽取出与标题相关度高的句子,用作生成式模型的指导信号;5)输入文本和指导信号输入给生成式模型,生成最终摘要;6)将生成摘要与参考摘要进行对比评价。本发明结合抽取式与生成式摘要模型对新闻文本进行摘要生成,可以让冗长的文本精简化,快速获取其中的关键信息。