一种基于谓词论元结构的层次机器翻译方法及系统

    公开(公告)号:CN103577398B

    公开(公告)日:2016-05-25

    申请号:CN201310487641.X

    申请日:2013-10-17

    Abstract: 本发明涉及一种基于谓词论元结构的层次机器翻译方法及系统,包括训练和翻译过程,将句子中所有的谓词论元结构有机的组织成图状结构,再将此结构作为改进层次短语机器翻译的顶层语义骨架结构,从而直接将谓词论元结构建模到层次短语机器翻译中,将语义独立的片段单独翻译并依据它们之间的结构组合成最终译文,由此得到的译文具有更好的语义相关性、语义结构和长距离调序特征,并因此降低了机器翻译生成毫无意义译文的概率。

    依存映射方法及系统
    2.
    发明授权

    公开(公告)号:CN102760121B

    公开(公告)日:2014-08-06

    申请号:CN201210222936.X

    申请日:2012-06-28

    Abstract: 本发明提供一种依存映射方法,该方法首先在源语言与目标语言的双语语料库的基础上,经依存映射得到目标语言的依存句法信息并建立当前的目标语言依存句法分析模型及依存句法分析器;然后基于映射依存特征实例集合和无监督特征实例集合,对目标语言依存句法模型进行训练,以得到最优的依存句法分析模型并通过该最优的依存句法分析模型来构造最终的目标依存语法分析器。其中,映射依存特征实例集合是从经依存映射后的目标语言的依存句法信息中抽取的,无监督特征实例集合是从通过当前的目标语言依存句法分析器对目标语言库进行句法分析而得到依存树中抽取的。这种依存映射方法可以最大限度地保留映射的依存信息,并且能够鲁棒的处理噪声信息。

    依存映射方法及系统
    3.
    发明公开

    公开(公告)号:CN102760121A

    公开(公告)日:2012-10-31

    申请号:CN201210222936.X

    申请日:2012-06-28

    Abstract: 本发明提供一种依存映射方法,该方法首先在源语言与目标语言的双语语料库的基础上,经依存映射得到目标语言的依存句法信息并建立当前的目标语言依存句法分析模型及依存句法分析器;然后基于映射依存特征实例集合和无监督特征实例集合,对目标语言依存句法模型进行训练,以得到最优的依存句法分析模型并通过该最优的依存句法分析模型来构造最终的目标依存语法分析器。其中,映射依存特征实例集合是从经依存映射后的目标语言的依存句法信息中抽取的,无监督特征实例集合是从通过当前的目标语言依存句法分析器对目标语言库进行句法分析而得到依存树中抽取的。这种依存映射方法可以最大限度地保留映射的依存信息,并且能够鲁棒的处理噪声信息。

    一种双语无监督句法分析方法及系统

    公开(公告)号:CN104281564B

    公开(公告)日:2017-08-08

    申请号:CN201410394850.4

    申请日:2014-08-12

    Inventor: 刘凯 姜文斌 刘群

    Abstract: 本发明公开了一种双语无监督句法分析方法及系统,该方法包括以下步骤:步骤1,在双语语料源端和目标端分别建立随机句法分析树库;步骤2,在该随机句法分析树库上通过计算单语无监督句法分析树的概率来单独训练单语无监督句法分析模型;步骤3,通过计算松弛同构相似度和双语句法分析算法对该单语无监督句法分析模型进行双语句法分析,得到最为满足松弛同构双语句法分析目标的双语句法分析树库,并用以替换该随机句法分析树库;步骤4,重复上述步骤1‑步骤3,直至该单语无监督句法分析模型收敛。由此,获得更好的单语无监督句法分析模型,以用于所有需要句法分析的下游应用中。

    一种用于盲人读取汉字的方法及系统

    公开(公告)号:CN105404621A

    公开(公告)日:2016-03-16

    申请号:CN201510623525.5

    申请日:2015-09-25

    Abstract: 本发明提出一种用于盲人读取汉字的方法及系统,涉及自然语言处理技术领域和面向残疾人的人机交互技术领域,该方法包括获取汉语文本,对所述汉语文本进行分词操作,生成汉字串,通过发音词典、多音字字典与词频信息,参考分词得到的词性标注,将所述汉字串中的每个词转换为对应的拼音并连接为拼音串;通过查找拼音和盲符的对照字典,将所述拼音串转换为盲符串,通过分词模型对所述盲符串进行盲文分词,生成初始盲文分词,将所述汉字串与所述初始盲文分词进行融合,生成新盲文分词,根据盲文分词连写规则对所述新盲文分词进行调整;对根据盲文分词连写规则调整后的所述新盲文分词进行盲文标调,生成最终盲文分词,将所述最终盲文分词进行显示。

    一种双语无监督句法分析方法及系统

    公开(公告)号:CN104281564A

    公开(公告)日:2015-01-14

    申请号:CN201410394850.4

    申请日:2014-08-12

    Inventor: 刘凯 姜文斌 刘群

    Abstract: 本发明公开了一种双语无监督句法分析方法及系统,该方法包括以下步骤:步骤1,在双语语料源端和目标端分别建立随机句法分析树库;步骤2,在该随机句法分析树库上通过计算单语无监督句法分析树的概率来单独训练单语无监督句法分析模型;步骤3,通过计算松弛同构相似度和双语句法分析算法对该单语无监督句法分析模型进行双语句法分析,得到最为满足松弛同构双语句法分析目标的双语句法分析树库,并用以替换该随机句法分析树库;步骤4,重复上述步骤1-步骤3,直至该单语无监督句法分析模型收敛。由此,获得更好的单语无监督句法分析模型,以用于所有需要句法分析的下游应用中。

    一种用于盲人读取汉字的方法及系统

    公开(公告)号:CN105404621B

    公开(公告)日:2018-07-10

    申请号:CN201510623525.5

    申请日:2015-09-25

    Abstract: 本发明提出一种用于盲人读取汉字的方法及系统,涉及自然语言处理技术领域和面向残疾人的人机交互技术领域,该方法包括获取汉语文本,对所述汉语文本进行分词操作,生成汉字串,通过发音词典、多音字字典与词频信息,参考分词得到的词性标注,将所述汉字串中的每个词转换为对应的拼音并连接为拼音串;通过查找拼音和盲符的对照字典,将所述拼音串转换为盲符串,通过分词模型对所述盲符串进行盲文分词,生成初始盲文分词,将所述汉字串与所述初始盲文分词进行融合,生成新盲文分词,根据盲文分词连写规则对所述新盲文分词进行调整;对根据盲文分词连写规则调整后的所述新盲文分词进行盲文标调,生成最终盲文分词,将所述最终盲文分词进行显示。

    一种基于谓词论元结构的层次机器翻译方法及系统

    公开(公告)号:CN103577398A

    公开(公告)日:2014-02-12

    申请号:CN201310487641.X

    申请日:2013-10-17

    Abstract: 本发明涉及一种基于谓词论元结构的层次机器翻译方法及系统,包括训练和翻译过程,将句子中所有的谓词论元结构有机的组织成图状结构,再将此结构作为改进层次短语机器翻译的顶层语义骨架结构,从而直接将谓词论元结构建模到层次短语机器翻译中,将语义独立的片段单独翻译并依据它们之间的结构组合成最终译文,由此得到的译文具有更好的语义相关性、语义结构和长距离调序特征,并因此降低了机器翻译生成毫无意义译文的概率。

    基于依存树的统计机器翻译方法及系统

    公开(公告)号:CN104239290B

    公开(公告)日:2017-02-15

    申请号:CN201410389422.2

    申请日:2014-08-08

    Abstract: 本发明提供一种基于依存边转换的统计机器翻译方法,根据从双语语料库中抽取的转换规则,将源语言句子的依存树中每条依存边转换为对应的目标语言短语依存边,并对所得到的目标语言短语依存边进行拼接,以生成目标语言端译文。该方法结合依存句法模型的优势,但采用分析-转换-生成的模式将翻译过程拆解成了三个阶段,可以对三个过程分别独立建模,使得对目标语言端句子的生成过程进行更为精确的控制成为可能。该采用基于依存边的转换保留了更多的知识,可以容忍更高程度的句法非同构现象,而且取得超过当前主流的基于短语模型翻译的方法的性能。

    翻译一致性的方法和装置及统计机器翻译方法和系统

    公开(公告)号:CN104298663B

    公开(公告)日:2017-01-18

    申请号:CN201410520322.9

    申请日:2014-09-30

    Abstract: 本发明提供一种评价术语领域翻译一致性的方法,该方法以双语平行语料库的文档-主题分布信息作为术语翻译的领域信息,构建双语术语库,并计算每个源语言术语的翻译一致性强度来客观地评价在领域内术语翻译的一致性。该方法充分利用领域信息,在术语翻译中保持源语言术语的译文在相同或相近领域内一致。而且该方法可以嵌入到统计机器翻译中,改进源语言术语所在的句子、篇章文档的整体翻译质量。

Patent Agency Ranking