发明授权
- 专利标题: 多阶段训练文本标题生成模型的方法及装置
-
申请号: CN202310443810.3申请日: 2023-04-24
-
公开(公告)号: CN116151232B公开(公告)日: 2023-08-29
- 发明人: 王芳 , 暴宇健
- 申请人: 北京龙智数科科技服务有限公司
- 申请人地址: 北京市朝阳区北苑小街8号6号楼五层5305
- 专利权人: 北京龙智数科科技服务有限公司
- 当前专利权人: 北京龙智数科科技服务有限公司
- 当前专利权人地址: 北京市朝阳区北苑小街8号6号楼五层5305
- 代理机构: 北京嘉科知识产权代理事务所
- 代理商 杨波
- 主分类号: G06F40/258
- IPC分类号: G06F40/258 ; G06N20/00
摘要:
本公开涉及机器学习技术领域,提供了一种多阶段训练文本标题生成模型的方法及装置。该方法包括:获取第一训练数据集,利用第一训练数据集对文本标题生成模型进行第一阶段训练;获取第一文本数据集,利用第一阶段训练后的文本标题生成模型为第一文本数据集中的文本生成标题,根据第一文本数据集中的文本以及该文本对应的标题生成第二训练数据集;利用第二训练数据集对标题打分模型进行训练;获取第二文本数据集,利用第二文本数据集和训练后的标题打分模型对第一阶段训练后的文本标题生成模型进行第二阶段训练。采用上述技术手段,解决现有技术中,生成的文本标题不通顺以及语义不连贯的问题。
公开/授权文献
- CN116151232A 多阶段训练文本标题生成模型的方法及装置 公开/授权日:2023-05-23