用于生成式自动摘要生成的模型建立方法及摘要生成方法
摘要:
本公开提供了一种用于生成式自动摘要生成的模型建立方法,包括:S1、对文档‑摘要数据对集合中的摘要进行预处理,对文档‑摘要数据对集合中文档进行向量化,生成多个向量化文档;S2、对所述向量化文档进行聚类处理,生成预定数目的聚类类别,每个聚类类别包括一个文档簇;S3、获取每个所述文档簇中的高频词,作为每个聚类类别的特征词汇表;以及S4、将多个所述向量化文档以及多个预处理后的摘要输入至编码器&解码器框架进行训练,在训练过程中,基于文档所属的聚类类别确定该聚类类别的特征词汇表,至少基于该聚类类别的特征词汇表进行摘要词汇预测,训练收敛后即获得生成式自动摘要生成模型。
0/0