- 专利标题: 用于生成式自动摘要生成的模型建立方法及摘要生成方法
-
申请号: CN202011305043.2申请日: 2020-11-20
-
公开(公告)号: CN112507111B公开(公告)日: 2024-02-06
- 发明人: 周玉
- 申请人: 北京中科凡语科技有限公司
- 申请人地址: 北京市海淀区知春路63号51号楼10层1006
- 专利权人: 北京中科凡语科技有限公司
- 当前专利权人: 北京中科凡语科技有限公司
- 当前专利权人地址: 北京市海淀区知春路63号51号楼10层1006
- 代理机构: 湖北权上知识产权代理事务所
- 代理商 张建锋
- 优先权: 202011123298.7 2020.10.20 CN
- 主分类号: G06F16/34
- IPC分类号: G06F16/34 ; G06F16/35
摘要:
本公开提供了一种用于生成式自动摘要生成的模型建立方法,包括:S1、对文档‑摘要数据对集合中的摘要进行预处理,对文档‑摘要数据对集合中文档进行向量化,生成多个向量化文档;S2、对所述向量化文档进行聚类处理,生成预定数目的聚类类别,每个聚类类别包括一个文档簇;S3、获取每个所述文档簇中的高频词,作为每个聚类类别的特征词汇表;以及S4、将多个所述向量化文档以及多个预处理后的摘要输入至编码器&解码器框架进行训练,在训练过程中,基于文档所属的聚类类别确定该聚类类别的特征词汇表,至少基于该聚类类别的特征词汇表进行摘要词汇预测,训练收敛后即获得生成式自动摘要生成模型。
公开/授权文献
- CN112507111A 用于生成式自动摘要生成的模型建立方法及摘要生成方法 公开/授权日:2021-03-16