一种融合句法信息的濒危语言翻译模型方法

    公开(公告)号:CN116956944A

    公开(公告)日:2023-10-27

    申请号:CN202310960646.3

    申请日:2023-08-01

    Abstract: 本发明公布了一种融合句法信息的濒危语言翻译模型方法,包括:采用半自动化方式构建依存句法标准格式的濒危语言依存结构树库;基于双仿射分类器对濒危语言进行依存句法分析,构建基于双仿射分类器的濒危语言依存句法分析模型;将濒危语言依存结构树库中包含的词序索引、词性标注、支配词索引、依存句法关系标注作为句法特征加入到机器翻译模型编码端,构建濒危语言‑汉语神经机器翻译模型。本发明通过句法信息能够更加准确的完成对于濒危语言的翻译,并且克服了人工标注濒危语言语料费时费力、需要大量专业知识、数据量较少、使用常规神经机器翻译方法的效果较差等不足,大大提升了濒危语言翻译的有效性。

Patent Agency Ranking