一种统计机器翻译中的在线翻译模型选择方法

    公开(公告)号:CN101079028A

    公开(公告)日:2007-11-28

    申请号:CN200710099724.6

    申请日:2007-05-29

    Inventor: 吕雅娟 刘群 黄瑾

    Abstract: 本发明公开了一种统计机器翻译的在线翻译模型选择方法,包括训练和翻译两个阶段,训练阶段包括:收集双语平行语料库,根据类型,将双语平行语料库划分到不同的子语料库中;为子语料库训练候选翻译模型;为子语料库建立索引,得到语料库索引文件;翻译阶段包括:输入待翻译文本,从语料库索引文件中检索与待翻译文本中的句子相似的句子;根据检索结果,得到与相似句子所在子语料库所对应的候选翻译模型,从所有的候选翻译模型中选择最终翻译模型;根据最终翻译模型对输入的待翻译文本进行翻译,得到最后的翻译结果。本发明很好地解决了统计机器翻译系统不能适应不同领域输入文本的问题,能够有效地提高统计机器翻译系统的翻译质量。

    一种统计机器翻译中的在线翻译模型选择方法和系统

    公开(公告)号:CN100527125C

    公开(公告)日:2009-08-12

    申请号:CN200710099724.6

    申请日:2007-05-29

    Inventor: 吕雅娟 刘群 黄瑾

    Abstract: 本发明公开了一种统计机器翻译的在线翻译模型选择方法,包括训练和翻译两个阶段,训练阶段包括:收集双语平行语料库,根据类型,将双语平行语料库划分到不同的子语料库中;为子语料库训练候选翻译模型;为子语料库建立索引,得到语料库索引文件;翻译阶段包括:输入待翻译文本,从语料库索引文件中检索与待翻译文本中的句子相似的句子;根据检索结果,得到与相似句子所在子语料库所对应的候选翻译模型,从所有的候选翻译模型中选择最终翻译模型;根据最终翻译模型对输入的待翻译文本进行翻译,得到最后的翻译结果。本发明很好地解决了统计机器翻译系统不能适应不同领域输入文本的问题,能够有效地提高统计机器翻译系统的翻译质量。

    一种融合了句型模板和统计机器翻译技术的翻译方法

    公开(公告)号:CN101206643A

    公开(公告)日:2008-06-25

    申请号:CN200610165532.6

    申请日:2006-12-21

    Abstract: 本发明公开了一种融合了句型模板和统计机器翻译技术的翻译方法,该方法包括:A、配置句型模板,建立句型模板库;B、利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句子,并执行步骤D;否则,执行步骤C;C、将输入的源语言按照标点符号切分成子句,对切分的子句进行匹配,将切分的子句转换成包含源语言词语与目标语言词语的句子;D、将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统进行翻译,得到翻译结果。利用本发明,解决了统计机器翻译系统不能很好的翻译具有固定句型结构句子的问题,使对具有固定句型结构的句子的翻译更加流畅。

    一种融合了句型模板和统计机器翻译技术的翻译方法

    公开(公告)号:CN100543727C

    公开(公告)日:2009-09-23

    申请号:CN200610165532.6

    申请日:2006-12-21

    Abstract: 本发明公开了一种融合了句型模板和统计机器翻译技术的翻译方法,该方法包括:A、配置句型模板,建立句型模板库;B、利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句子,并执行步骤D;否则,执行步骤C;C、将输入的源语言按照标点符号切分成子句,对切分的子句进行匹配,将切分的子句转换成包含源语言词语与目标语言词语的句子;D、将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统进行翻译,得到翻译结果。利用本发明,解决了统计机器翻译系统不能很好的翻译具有固定句型结构句子的问题,使对具有固定句型结构的句子的翻译更加流畅。

Patent Agency Ranking