-
公开(公告)号:CN101989261B
公开(公告)日:2013-03-13
申请号:CN200910164809.7
申请日:2009-08-01
Applicant: 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 本发明提供一种统计机器翻译短语抽取方法,包括下列步骤:1)从两个方向对双语语料获得多个对齐句对组合,并计算所述多个对齐句对组合的先验概率;2)由所述多个对齐句对组合的词语对的先验概率之和计算所述词语对的对齐概率,由所述词语对的对齐概率构成对齐矩阵;3)根据所述对齐矩阵,计算短语对齐的频度;4)根据所述短语对齐的频度计算的所述短语对齐的相对频度和词汇化概率。本发明能够有效表示所有可能的对齐短语组合,提高了短语抽取的质量,进而能够提高根据所抽取的短语进行翻译的质量。
-
公开(公告)号:CN101989261A
公开(公告)日:2011-03-23
申请号:CN200910164809.7
申请日:2009-08-01
Applicant: 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 本发明提供一种统计机器翻译短语抽取方法,包括下列步骤:1)从两个方向对双语语料获得多个对齐句对组合,并计算所述多个对齐句对组合的先验概率;2)由所述多个对齐句对组合的词语对的先验概率之和计算所述词语对的对齐概率,由所述词语对的对齐概率构成对齐矩阵;3)根据所述对齐矩阵,计算短语对齐的频度;4)根据所述短语对齐的频度计算的所述短语对齐的相对频度和词汇化概率。本发明能够有效表示所有可能的对齐短语组合,提高了短语抽取的质量,进而能够提高根据所抽取的短语进行翻译的质量。
-