-
公开(公告)号:CN111581991B
公开(公告)日:2022-05-27
申请号:CN202010409944.X
申请日:2020-05-14
Applicant: 兰州大学
IPC: G06F40/58 , G06F40/289 , G06F40/126 , G06F40/157
Abstract: 本发明涉及一种基于端到端神经机器翻译的汉盲翻译方法及系统,所述方法至少包括:基于端到端深度学习构建能够学习汉语文本到盲文ASCII码直接转换的映射函数的端到端神经机器翻译模型;基于现存未经处理的汉语到盲文ASCII码转换的对照语料库训练所述端到端神经机器翻译模型。本发明基于端到端深度学习思想,直接绕过分词、标调、合成等多个翻译处理阶段,通过训练较大的端到端神经机器翻译模型进行翻译,能够一步直接得到汉语文本的盲文翻译结果,随着训练数据的不断增加,相比多阶段处理的翻译方式能够在短时间、低成本、系统复杂度降低的情况下显著提高盲文翻译的准确率。
-
公开(公告)号:CN111581985A
公开(公告)日:2020-08-25
申请号:CN202010409821.6
申请日:2020-05-14
Applicant: 兰州大学
IPC: G06F40/47 , G06F40/126 , G06F40/117 , G06F40/289
Abstract: 本发明涉及一种基于Transformer的汉盲翻译方法及系统,所述方法至少包括:基于现有句子级对应的汉盲数字资源训练翻译模型;基于Transformer构建以句子为单位将汉语文本直接转换为盲文ASCII码的所述翻译模型,其中,所述翻译模型基于多头自注意力机制至少将输入、输出、输入-输出的信息关联的方式学习所述汉盲数字资源。本发明以句子为单位进行翻译,不需要构建词语级精确对应的汉盲对照语料库,使得本发明能够直接利用现存的汉盲数字资源,只需要经过句子切分处理就能使用,从而建设难度小、耗时短,显著地降低了构建语料库的成本。
-
公开(公告)号:CN111581991A
公开(公告)日:2020-08-25
申请号:CN202010409944.X
申请日:2020-05-14
Applicant: 兰州大学
IPC: G06F40/58 , G06F40/289 , G06F40/126 , G06F40/157
Abstract: 本发明涉及一种基于端到端神经机器翻译的汉盲翻译方法及系统,所述方法至少包括:基于端到端深度学习构建能够学习汉语文本到盲文ASCII码直接转换的映射函数的端到端神经机器翻译模型;基于现存未经处理的汉语到盲文ASCII码转换的对照语料库训练所述端到端神经机器翻译模型。本发明基于端到端深度学习思想,直接绕过分词、标调、合成等多个翻译处理阶段,通过训练较大的端到端神经机器翻译模型进行翻译,能够一步直接得到汉语文本的盲文翻译结果,随着训练数据的不断增加,相比多阶段处理的翻译方式能够在短时间、低成本、系统复杂度降低的情况下显著提高盲文翻译的准确率。
-
公开(公告)号:CN111581985B
公开(公告)日:2022-05-24
申请号:CN202010409821.6
申请日:2020-05-14
Applicant: 兰州大学
IPC: G06F40/47 , G06F40/126 , G06F40/117 , G06F40/289
Abstract: 本发明涉及一种基于Transformer的汉盲翻译方法及系统,所述方法至少包括:基于现有句子级对应的汉盲数字资源训练翻译模型;基于Transformer构建以句子为单位将汉语文本直接转换为盲文ASCII码的所述翻译模型,其中,所述翻译模型基于多头自注意力机制至少将输入、输出、输入‑输出的信息关联的方式学习所述汉盲数字资源。本发明以句子为单位进行翻译,不需要构建词语级精确对应的汉盲对照语料库,使得本发明能够直接利用现存的汉盲数字资源,只需要经过句子切分处理就能使用,从而建设难度小、耗时短,显著地降低了构建语料库的成本。
-
-
-