基于Encoder的汉语到盲文的自动转换方法及系统

    公开(公告)号:CN116702713A

    公开(公告)日:2023-09-05

    申请号:CN202310659863.9

    申请日:2023-06-06

    Applicant: 兰州大学

    Abstract: 本申请公开了基于Encoder的汉语到盲文的自动转换方法及系统,其中方法步骤包括:构建汉盲平行语料库,并对汉盲平行语料库进行预处理,得到处理后数据;对处理后数据进行编码,得到编码后数据;构建预训练Encoder模型;使用编码后数据对预训练Encoder模型进行微调,得到最终的翻译模型;利用翻译模型,完成汉语到盲文的转换。本申请摒弃了传统端到端神经机器翻译模型的Decoder框架,预测时是并行预测出每个汉字对应的类别,所以推理速度大大加快,相较于传统的自回归Transformer模型推理速度提高了50倍,模型bleu值也取得了提升。

    一种基于两部分Loss的汉盲自动转换方法及系统

    公开(公告)号:CN118378639A

    公开(公告)日:2024-07-23

    申请号:CN202410628465.5

    申请日:2024-05-21

    Applicant: 兰州大学

    Inventor: 苏伟 于海龙

    Abstract: 本发明公开了一种基于两部分Loss的汉盲自动转换方法及系统,包括:构建汉盲平行语料库,对汉盲平行语料库进行处理,获得不带分词的盲点序列、盲点对应的盲文分词标记序列与汉语序列,均进行编码;构建机器翻译模型,基于编码后的数据对机器翻译模型进行训练,获得基于两部分Loss的机器翻译模型;将待转换汉语句子输入模型中,获得预测盲点序列与分词标记,基于分词标记与预测盲点序列获得最终盲文序列,完成汉盲自动转换。本发明进行端到端汉盲翻译的同时考虑到使用两个Loss分别优化盲点生成以及盲文分词两个任务,在翻译过程中的每个时间步预测盲点及分词标记,从而得到最终的盲文序列,准确率得到了提高。

    一种基于预训练模型的汉语到盲文的自动转换方法及系统

    公开(公告)号:CN116681037A

    公开(公告)日:2023-09-01

    申请号:CN202310659895.9

    申请日:2023-06-06

    Applicant: 兰州大学

    Abstract: 本申请公开了一种基于预训练模型的汉语到盲文的自动转换方法及系统,其中方法包括以下步骤:构建预训练语料库、汉盲平行语料库和机器翻译模型;对所述预训练语料库和所述汉盲平行语料库进行编码,得到编码后预训练语料库和编码后汉盲平行语料库;基于所述编码后预训练语料库对所述机器翻译模型进行预训练,得到预训练模型;基于所述编码后汉盲平行语料库对所述预训练模型进行参数微调,得到转换模型;将汉语输入至所述转换模型中进行翻译,得到盲文序列,完成汉盲翻译。本申请可以将汉语一步地转换为对应的盲文,并且大大减少了模型对平行数据的依赖,使用少量数据进行训练,也可以达到很好的效果。

Patent Agency Ranking