-
公开(公告)号:CN116502636A
公开(公告)日:2023-07-28
申请号:CN202310241423.1
申请日:2023-03-14
Applicant: 北京理工大学
IPC: G06F40/284 , G06F40/166 , G06N3/0442 , G06N3/0455 , G06N3/096 , G06N5/02
Abstract: 本发明公开了一种基于知识驱动的跨语言简讯生成方法,属于自然语言处理技术领域。首先通过Bi‑RNN网络模拟单词之间的相互作用,采用原型文档和简讯之间的双向注意机制分析相互依赖关系,最终根据隐状态的加权求和得到“简讯模式”。然后基于多任务学习来共享解码器的参数,通过共享整个解码器来执行翻译和简讯生成任务。最后将获取的知识融合在跨语言简讯生成模型的解码器中,让其参与到最终简讯生成的过程,使用预训练‑微调范式,进一步解决低资源的问题。本方法能够生成更专业、更符合要求的科技简讯,解决了低资源的问题,即使在训练数据资源较少的情况下,也能跨语言生成较高质量的科技简讯。