一种古文到英文的固定风格翻译方法及系统

    公开(公告)号:CN116070643B

    公开(公告)日:2023-08-15

    申请号:CN202310343986.1

    申请日:2023-04-03

    Inventor: 杨红征 刘鑫

    Abstract: 本发明提供一种古文到英文的固定风格翻译方法及系统,方法包括:对获取的古文诗词和对应的英文翻译诗词进行子句对齐和分词操作,获取古文诗词分词语料库、古文翻译分词语料库和古文诗词翻译风格语料库;基于语料库分别对分词模型和古文诗词翻译风格模型进行训练;基于古文诗词翻译风格模型对古文诗词进行预测,输出英文翻译,对翻译风格进行分析。本发明针对固定风格的翻译问题,构建了固定翻译风格的古文诗词分词语料库以及其对应的古文翻译分词语料库,根据固定翻译风格对分词网络进行训练,形成了固定翻译风格的分词模型,解决了固定风格的翻译问题。

    文本处理方法、装置、介质和计算设备

    公开(公告)号:CN110807334B

    公开(公告)日:2023-07-21

    申请号:CN201911043164.1

    申请日:2019-10-29

    Abstract: 本发明的实施方式提供了一种文本处理方法。所述方法包括获取源文本和目标文本;根据源文本的第一段落数a和目标文本的第二段落数b,确定分割段落对,该分割段落对包括针对源文本的第一段落序号和针对目标文本的第二段落序号;根据分割段落对,分割源文本和目标文本,得到多个子源文本和与多个子源文本一一对应的多个子目标文本;以及采用预定对齐算法,对齐多个子源文本和多个子目标文本。本发明的方法、装置、介质以及计算设备通过先将两个文本划分为多个子文本,再对子文本进行对齐,可以降低后续段落对齐和句子对齐时因文本不规范导致的级联错误,从而提升文本对齐质量,并因此降低对两个文本的质量要求。

    耳机翻译方法和系统
    53.
    发明授权

    公开(公告)号:CN108509428B

    公开(公告)日:2023-04-18

    申请号:CN201810162977.1

    申请日:2018-02-26

    Inventor: 李建明

    Abstract: 本发明实施例公开了一种耳机翻译方法,其特征在于,应用于包括第一耳机,第二耳机和耳机收纳盒的耳机系统,所述翻译方法包括:第一耳机与第二耳机和耳机收纳盒建立无线连接;第二耳机接收主控制指令,向第一耳机发起主控制申请;第一耳机接收所述主控制申请,并向所述耳机收纳盒转发所述主控制申请;耳机收纳盒断开与第一耳机的无线连接,建立与第二耳机的无线连接;第二耳机获取第一音频,并将第一音频发送到耳机收纳盒;耳机收纳盒接收第一音频,根据第一音频获取第一音频经翻译得到的第二音频,并将第二音频发送给第二耳机;第二耳机接所述第二音频,并将其发送给第一耳机进行播放。采用本发明,可提升不同种类语言之间的翻译效率。

    一种人名翻译方法、系统、设备及计算机可读存储介质

    公开(公告)号:CN115310458A

    公开(公告)日:2022-11-08

    申请号:CN202210949527.3

    申请日:2022-08-09

    Inventor: 苑聪虎

    Abstract: 本发明公开了一种人名翻译方法、系统、设备及计算机可读存储介质,所述方法包括以下步骤:根据越南姓氏的越南字母获取对应的英文字母,并将越南人名单词的越南字母转为英文字母形式;根据收集的越南姓氏以及越南人名对应的英文字母,将越南姓氏以及越南人名,转为英文字母形式的男性名字对照数据和英文字母形式的女性名字对照数据;利用收集的男性名字对照数据和女性名字对照数据训练一个性别识别分类器;通过正则表达式找中文中以大写字母开头连续两个单词以上的姓名。本发明能正确转换成中文人名,极大的提高越南人名翻译的准确度,提高越南语的机器翻译水平。

    一种数据的处理方法、系统、设备及计算机可读存储介质

    公开(公告)号:CN115293175A

    公开(公告)日:2022-11-04

    申请号:CN202210949534.3

    申请日:2022-08-09

    Inventor: 苑聪虎

    Abstract: 本发明公开了一种数据的处理方法、系统、设备及计算机可读存储介质,所述方法包括以下步骤:抽取待翻译句子中的数字;将抽取的数字转成无单位数字,具体包括:定义表示数字范围的符号;将所述抽取的数字与定义的数字范围的符号进行对比;根据对比结果,将所述抽取的数字转换成无单位数字;将所述无单位数字输入至神经网络机器翻译模型进行训练。本发明不会导致后续翻译对这类数字翻译出错,可以提高机器翻译的质量。

    一种翻译方法、装置、电子设备以及存储介质

    公开(公告)号:CN108345590B

    公开(公告)日:2022-05-31

    申请号:CN201711460034.9

    申请日:2017-12-28

    Abstract: 本发明实施例提供了一种翻译方法、装置、电子设备以及存储介质,以提高翻译的准确性。所述的方法包括:依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文;依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。能够减少替代符查询源文本中对应的源词汇的偏差,提高翻译的准确性。

    翻译评测方法和系统、电子设备及可读存储介质

    公开(公告)号:CN114462428A

    公开(公告)日:2022-05-10

    申请号:CN202210032270.5

    申请日:2022-01-12

    Abstract: 本说明书实施例提供了翻译评测方法和系统、电子设备及可读存储介质,其中一种翻译评测方法包括:获取源语内容、目标语参考答案,以及源语种和目标语种信息;获取对所述源语内容进行翻译得到的目标语结果;基于所述目标语参考答案和所述目标语结果,进行句子对齐,生成句对齐信息;根据所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语结果的特征;将所述目标语结果的特征输入完成预训练的多维能力模型,生成对应的翻译评测结果。采用上述方案,能够在保障评测质量的情况下,提高翻译评测的效率。

    翻译评测训练数据的生成方法及装置、设备和存储介质

    公开(公告)号:CN114254658A

    公开(公告)日:2022-03-29

    申请号:CN202111527223.X

    申请日:2021-12-14

    Inventor: 王永杰

    Abstract: 一种翻译评测训练数据的生成方法及装置、设备和存储介质,方法包括:获取待翻译的样本原始语句;获取样本原始语句相对应的样本翻译语句;获取样本原始语句相对应的参考翻译集合,包括多个参考翻译语句;选取与样本翻译语句相似度最高的参考翻译语句作为样本后编辑语句;利用样本后编辑语句和样本翻译语句获取样本原始语句中各个词汇的样本翻译质量标签;根据样本翻译质量标签建立训练集。本发明利用原始语句的参考翻译语句来生成样本后编辑语句,因此在没有公开的后编辑数据的情况下,无需通过人工来进行后编辑或标注标签,仍能获取后编辑语句和样本翻译质量标签,从而在获得用于训练翻译评测模型的训练数据的同时,确保翻译评测模型的训练效率。

    利用同源词的日中机器翻译方法和系统

    公开(公告)号:CN114169345A

    公开(公告)日:2022-03-11

    申请号:CN202111262328.7

    申请日:2021-10-28

    Abstract: 本发明提供一种利用同源词的日中机器翻译方法、系统、存储介质和电子设备,涉及机器翻译技术领域。本发明将存在汉语同源词的日语词语转化为对应的同源词字形,获取所述同源词字形在共享词典下的词向量表示,记作公有表示,以及获取所当前词语在日语词典下的词向量表示,记作私有表示,合并所述公有表示和私有表示作为当前词语最终的词向量表示。通过利用同源汉字得到中日同源词,扩大了双语间共享的词语数量,且在神经机器翻译中利用共享词嵌入方法,得到更一致的双语语义对齐,从理论上有利于最终翻译效果的提升;此外,存在汉语同源词的日语词语采用公有‑私有表示的方法,可以建模日语中同源词语义上偏离其原先语义的语言现象。

Patent Agency Ranking