-
公开(公告)号:CN112417138A
公开(公告)日:2021-02-26
申请号:CN202011284266.5
申请日:2020-11-17
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种结合指针生成式与自注意力机制的短文本自动摘要方法,包括:对数据集进行分词处理训练,训练得到的结果作为编码器端的输入;在编码器与解码器底部嵌入中加入位置编码;利用解码器当前时刻以及前一时刻的输出,以及注意力分布拼接得到指针生成网络的生成概率,控制复制源文本中内容生成摘要或根据注意力生成摘要,若词汇分布中不存在解码的词,则利用多头部注意力分布复制得到,若词汇分布中存在解码的词,则使用解码的词的分布式表示。本发明提升摘要效果的基础上减少训练时间,提高工作者的浏览和处理信息的效率,降低信息负载。