一种多语种语料对齐方法、装置、设备及介质

    公开(公告)号:CN114282554B

    公开(公告)日:2025-01-28

    申请号:CN202111612435.8

    申请日:2021-12-27

    Abstract: 本发明公开了一种多语种语料对齐方法、装置、设备及介质,涉及自然语言处理技术领域。该方法通过获取原始文本,并通过语种识别技术对原始文本进行语种识别,得到原始文本的语种作为目标语种;从目标语种中选定一个语种作为标准语种,并将目标语种中剩余的语种作为待翻译语种;将待翻译语种对应的原始文本翻译成标准语种的标准文本,并对所有标准文本进行对齐识别,获取语料对齐结果,以实现三种及三种以上语种之间的语料对齐。

    一种基于意群的翻译方法、装置、设备及介质

    公开(公告)号:CN114372481A

    公开(公告)日:2022-04-19

    申请号:CN202111660857.2

    申请日:2021-12-30

    Abstract: 本发明公开了一种基于意群的翻译方法、装置、设备及介质,涉及自然语言处理技术领域。该方法通过获取待翻译文本,将待翻译文本与翻译记忆库中的原文进行匹配,得到文本匹配率;当文本匹配率低于匹配率阈值,则根据意群本身的属性,即在意思上相对完整、在语法上密切联系、不能再分的一个词组,对待翻译文本进行意群切分,得到意群文本;基于意群文本与翻译记忆库中的原文进行匹配,当得到的意群匹配结果为匹配一致时,则基于匹配一致的原文从翻译记忆库中选择对应的译文作为意群文本的译文,提高翻译准确性和效率。

    一种CAT系统中翻译记忆库和MT结合的方法及系统

    公开(公告)号:CN108519979A

    公开(公告)日:2018-09-11

    申请号:CN201810166792.8

    申请日:2018-02-28

    Abstract: 本发明公开了一种CAT系统中翻译记忆库和MT结合的方法,包括以下步骤:当用户在CAT中执行翻译原文任务时,将翻译原文发送至翻译记忆库;将翻译原文与翻译记忆库进行匹配;如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文发送至用户;如果翻译原文与翻译记忆库匹配失败,则将翻译原文进行机器翻译,并将机器翻译后的翻译译文发送至用户;公开了采用该方法的系统。本发明一种CAT系统中翻译记忆库和MT结合的方法及系统,应用于专业领域时,通过机器翻译出来的译文可以作为参考,并且产生大量的翻译样本,有利于专业领域中翻译记忆库的扩充,避免了在专业领域中过分依赖人工翻译的弊病,提高了翻译效率,降低了翻译成本。

    用于机器翻译的数词和序号替换方法及系统

    公开(公告)号:CN107066454A

    公开(公告)日:2017-08-18

    申请号:CN201710187175.1

    申请日:2017-03-27

    CPC classification number: G06F17/2827 G06F17/289

    Abstract: 本发明公开了用于机器翻译的数词和序号替换方法,通过选取参考句、参考译文、序号表和数词表,将原文中的序号和数词替换为符合译文用语习惯的序号和数词,而参考句、参考译文、序号表和数词表随着语言变化和用语环境变化而变化时,本发明就可以用于多种语言和用语环境,提高了翻译的适用性和通用性。本发明公开了用于机器翻译的数词和序号替换系统,通过选取单元选取参考句、参考译文、序号表和数词表,替换单元将原文中的序号和数词替换为符合译文用语习惯的序号和数词,而参考句、参考译文、序号表和数词表随着语言变化和用语环境变化而变化时,本发明就可以用于多种语言和用语环境,提高了翻译的适用性和通用性。

    基于线性回归适用于多语种的句子相似度获取方法及系统

    公开(公告)号:CN107066443A

    公开(公告)日:2017-08-18

    申请号:CN201710187215.2

    申请日:2017-03-27

    CPC classification number: G06F17/271 G06F17/274 G06F17/277

    Abstract: 本发明公开了基于线性回归适用于多语种的句子相似度获取方法包括以下步骤:获取两个句子的两个及以上相似特征值;根据两个句子所属语种和应用领域选取每个相似特征值对应的特征权值;将两个及以上相似特征值根据每个相似特征值对应的特征权值进行线性回归,得出两个句子的复合相似特征值。本发明公开了基于线性回归适用于多语种的句子相似度获取系统,包括获取单元;选择单元;线性回归单元。本发明基于线性回归适用于多语种的句子相似度获取方法和系统,通过对句子不同相似特征值进行加权线性回归,适用于多种语言与多种场合。

    多译员协同翻译系统及方法

    公开(公告)号:CN105989439A

    公开(公告)日:2016-10-05

    申请号:CN201510071321.5

    申请日:2015-02-11

    Inventor: 张马成 王兴强

    Abstract: 本发明公开了一种多译员协同翻译系统及方法,包括通过互联网连接的翻译端、用户端和数据服务端;数据服务端,存储有翻译端和用户端的记忆库,记忆库是译员和客户在进行翻译时产生的语言对,所述语言对为源语言和对应的目标语言,所述记忆库还存储有翻译端和用户端的信息数据;翻译端,用于译员接收任务,并在翻译端进行翻译工作;用户端,用于客户寻找译员,以及发送翻译任务到译员;实现了多译员协同进行翻译,且能自动进行低错检查,能自动拆分文件,能自动生成对照文,进而实现翻译效率较高,翻译质量较高的技术效果。

    一种翻译文本自动处理方法、设备及介质

    公开(公告)号:CN115757295A

    公开(公告)日:2023-03-07

    申请号:CN202211455109.5

    申请日:2022-11-21

    Abstract: 本发明公开了一种翻译文本自动处理方法、设备及介质,涉及翻译文本处理领域,解决了现有翻译文本处理流程复杂,处理效率低下的问题,方法包括:所述用户端的入口文件夹接收待处理文本;所述云服务器轮询所述入口文件夹,将所述待处理文本同步至所述翻译系统服务器;所述翻译系统服务器接收并存储所述待处理文本,执行可配置指令,获得已处理文本;所述翻译系统服务器将所述已处理文本经云服务器推送至所述用户端的出口文件夹。本发明可以根据用户需求配置处理流程,满足个性化需要,且面向用户的操作简单,只需将待处理文本拖拽至入口文件夹即可输出对应的结果产物。

Patent Agency Ranking