一种用于机器翻译的调序模型的生成方法和装置

    公开(公告)号:CN102053959A

    公开(公告)日:2011-05-11

    申请号:CN201010600035.0

    申请日:2010-12-13

    Abstract: 本发明提供了一种用于机器翻译的调序模型的生成方法,包括:获取双语语料库;对双语语料库中的源语言例句进行搭配抽取,以获取源语言搭配词对;对源语言例句以及目标语言例句进行双语词对齐,并根据双语词对齐结果确定源语言搭配词的对应译文;根据源语言搭配词在源语言例句中的顺序以及对应译文在目标语言例句的顺序确定源语言搭配词对的调序方向;对调序方向进行统计,获取每一调序方向的调序概率,以形成调序模型。通过上述方式,基于源语言的词与词之间的搭配信息建立调序模型,进而提高调序模型的调序能力。

    基于RNN模型的机器翻译方法和装置

    公开(公告)号:CN105183720A

    公开(公告)日:2015-12-23

    申请号:CN201510475973.5

    申请日:2015-08-05

    Inventor: 蓝翔 胡晓光 李伟

    Abstract: 本申请公开了基于RNN模型的机器翻译方法和装置。该方法的一具体实施方式包括:通过接收输入的待翻译语句,待翻译语句由待翻译词组成;确定待翻译词对应的候选词集合,候选词为待翻译词对应的翻译结果,候选词集合基于预先查找出的候选词生成;第一循环神经网络RNN模型基于待翻译词对应的词向量,生成用于表征待翻译语句的语义的高维向量;第二循环神经网络RNN模型基于高维向量以及候选词集合,确定待翻译语句对应的翻译语句。实现了在利用RNN模型进行翻译时,仅通过计算候选词的输出概率从而得到待翻译语句的翻译结果,提升了翻译速度。

    翻译方法和装置
    3.
    发明公开

    公开(公告)号:CN105117389A

    公开(公告)日:2015-12-02

    申请号:CN201510450967.4

    申请日:2015-07-28

    Inventor: 李伟 胡晓光 蓝翔

    Abstract: 本发明提出一种翻译方法和装置,该翻译方法包括:获取队列中得分最高的候选词,对所述得分最高的候选词进行扩展;从所述得分最高的候选词的扩展结果与所述得分最高的候选词对应栈的下一栈已有的候选词中,选择得分最高的N个候选词,N≥2,N为整数;将选择的N个候选词保存在所述得分最高的候选词对应栈的下一栈中,并更新所述队列中的候选词。本发明可以改进RNN的搜索过程,减少扩展的候选词的个数,从而提升搜索速度,减少翻译用时。

    基于RNN模型的机器翻译方法和装置

    公开(公告)号:CN105183720B

    公开(公告)日:2019-07-09

    申请号:CN201510475973.5

    申请日:2015-08-05

    Inventor: 蓝翔 胡晓光 李伟

    Abstract: 本申请公开了基于RNN模型的机器翻译方法和装置。该方法的一具体实施方式包括:通过接收输入的待翻译语句,待翻译语句由待翻译词组成;确定待翻译词对应的候选词集合,候选词为待翻译词对应的翻译结果,候选词集合基于预先查找出的候选词生成;第一循环神经网络RNN模型基于待翻译词对应的词向量,生成用于表征待翻译语句的语义的高维向量;第二循环神经网络RNN模型基于高维向量以及候选词集合,确定待翻译语句对应的翻译语句。实现了在利用RNN模型进行翻译时,仅通过计算候选词的输出概率从而得到待翻译语句的翻译结果,提升了翻译速度。

    翻译方法和装置
    5.
    发明授权

    公开(公告)号:CN105117389B

    公开(公告)日:2018-01-19

    申请号:CN201510450967.4

    申请日:2015-07-28

    Inventor: 李伟 胡晓光 蓝翔

    Abstract: 本发明提出一种翻译方法和装置,该翻译方法包括:获取队列中得分最高的候选词,对所述得分最高的候选词进行扩展;从所述得分最高的候选词的扩展结果与所述得分最高的候选词对应栈的下一栈已有的候选词中,选择得分最高的N个候选词,N≥2,N为整数;将选择的N个候选词保存在所述得分最高的候选词对应栈的下一栈中,并更新所述队列中的候选词。本发明可以改进RNN的搜索过程,减少扩展的候选词的个数,从而提升搜索速度,减少翻译用时。

    一种用于机器翻译的调序模型的生成方法和装置

    公开(公告)号:CN102053959B

    公开(公告)日:2012-07-04

    申请号:CN201010600035.0

    申请日:2010-12-13

    Abstract: 本发明提供了一种用于机器翻译的调序模型的生成方法,包括:获取双语语料库;对双语语料库中的源语言例句进行搭配抽取,以获取源语言搭配词对;对源语言例句以及目标语言例句进行双语词对齐,并根据双语词对齐结果确定源语言搭配词的对应译文;根据源语言搭配词在源语言例句中的顺序以及对应译文在目标语言例句的顺序确定源语言搭配词对的调序方向;对调序方向进行统计,获取每一调序方向的调序概率,以形成调序模型。通过上述方式,基于源语言的词与词之间的搭配信息建立调序模型,进而提高调序模型的调序能力。

Patent Agency Ranking