-
公开(公告)号:CN111708871A
公开(公告)日:2020-09-25
申请号:CN202010462879.7
申请日:2020-05-27
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
IPC: G06F16/332
Abstract: 本公开提供了一种对话状态跟踪方法、装置,涉及人工智能领域。该方法包括:获取历史对话和当前轮次对话,将历史对话、当前轮次对话、当前轮次对话中的槽和与当前轮次对话中的槽对应的值集合输入至对话状态跟踪模型;通过对话状态跟踪模型对历史对话、当前轮次对话、当前轮次对话中的槽和与当前轮次对话中的槽对应的值集合进行特征提取,以获取与当前轮次对话对应的对话状态;对话状态跟踪模型是基于自适应优化损失函数训练得到的,自适应优化损失函数包括槽优化系数和样本优化系数,并且槽优化系数是根据每个槽在验证数据集上的准确率确定的,样本优化系数是根据各轮次对话样本的置信度确定的。本公开能够改善对话状态跟踪中的槽不均衡问题。
-
公开(公告)号:CN110442878A
公开(公告)日:2019-11-12
申请号:CN201910533381.2
申请日:2019-06-19
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 本申请公开了一种翻译方法、机器翻译模型的训练方法、装置及存储介质,涉及人工智能领域,该方法包括:获取标注有参考翻译结果的样本语句;将样本语句输入待训练的机器翻译模型,得到样本语句的样本翻译结果,机器翻译模型为模型参数待调整的非自回归的模型;根据参考翻译结果计算词语翻译结果的梯度估计值,其中,梯度估计值是通过奖赏值计算得到的;根据梯度估计结果对机器翻译模型的模型参数进行调整。通过奖赏值计算梯度估计值,并根据梯度估计值对机器翻译模型的模型参数进行调整,以奖赏值为调整参考数据得到梯度估计值对模型参数进行调整,从而实现对机器翻译模型的序列级训练,提高训练后的机器翻译模型的翻译准确度。
-
公开(公告)号:CN110263349A
公开(公告)日:2019-09-20
申请号:CN201910176030.0
申请日:2019-03-08
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
Abstract: 本申请涉及一种语料评估模型训练方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取平行语料;所述平行语料包括源文本和相应的参考翻译文本;通过机器翻译模型对所述源文本进行翻译得到相应的机器翻译文本;将所述源文本和所述机器翻译文本共同作为语料评估模型的训练样本;对比所述机器翻译文本和所述参考翻译文本,得到与所述训练样本相应的训练标签;通过所述训练样本和相应的训练标签训练所述语料评估模型。本申请提供的方案可以提高模型训练效率和效果。
-
公开(公告)号:CN110263348A
公开(公告)日:2019-09-20
申请号:CN201910168264.0
申请日:2019-03-06
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
Abstract: 本发明涉及一种翻译方法、装置、计算机设备和存储介质,所述方法包括:获取目标源语句以及对所述目标源语句进行翻译得到的初始翻译语句;利用已训练的机器学习模型对所述目标源语句以及所述初始翻译语句进行编码,得到所述目标源语句对应的第一编码向量序列以及所述初始翻译语句对应的第二编码向量序列;利用所述机器学习模型对所述第一编码向量序列以及所述第二编码向量序列进行联合解码,得到语句调整操作序列;根据所述语句调整操作序列对所述初始翻译语句进行语句调整,得到所述目标源语句对应的目标翻译语句。上述方法可以提高翻译准确度。
-
公开(公告)号:CN104239290B
公开(公告)日:2017-02-15
申请号:CN201410389422.2
申请日:2014-08-08
Applicant: 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 本发明提供一种基于依存边转换的统计机器翻译方法,根据从双语语料库中抽取的转换规则,将源语言句子的依存树中每条依存边转换为对应的目标语言短语依存边,并对所得到的目标语言短语依存边进行拼接,以生成目标语言端译文。该方法结合依存句法模型的优势,但采用分析-转换-生成的模式将翻译过程拆解成了三个阶段,可以对三个过程分别独立建模,使得对目标语言端句子的生成过程进行更为精确的控制成为可能。该采用基于依存边的转换保留了更多的知识,可以容忍更高程度的句法非同构现象,而且取得超过当前主流的基于短语模型翻译的方法的性能。
-
公开(公告)号:CN104298663B
公开(公告)日:2017-01-18
申请号:CN201410520322.9
申请日:2014-09-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种评价术语领域翻译一致性的方法,该方法以双语平行语料库的文档-主题分布信息作为术语翻译的领域信息,构建双语术语库,并计算每个源语言术语的翻译一致性强度来客观地评价在领域内术语翻译的一致性。该方法充分利用领域信息,在术语翻译中保持源语言术语的译文在相同或相近领域内一致。而且该方法可以嵌入到统计机器翻译中,改进源语言术语所在的句子、篇章文档的整体翻译质量。
-
公开(公告)号:CN104298663A
公开(公告)日:2015-01-21
申请号:CN201410520322.9
申请日:2014-09-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种评价术语领域翻译一致性的方法,该方法以双语平行语料库的文档-主题分布信息作为术语翻译的领域信息,构建双语术语库,并计算每个源语言术语的翻译一致性强度来客观地评价在领域内术语翻译的一致性。该方法充分利用领域信息,在术语翻译中保持源语言术语的译文在相同或相近领域内一致。而且该方法可以嵌入到统计机器翻译中,改进源语言术语所在的句子、篇章文档的整体翻译质量。
-
公开(公告)号:CN104239290A
公开(公告)日:2014-12-24
申请号:CN201410389422.2
申请日:2014-08-08
Applicant: 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 本发明提供一种基于依存边转换的统计机器翻译方法,根据从双语语料库中抽取的转换规则,将源语言句子的依存树中每条依存边转换为对应的目标语言短语依存边,并对所得到的目标语言短语依存边进行拼接,以生成目标语言端译文。该方法结合依存句法模型的优势,但采用分析-转换-生成的模式将翻译过程拆解成了三个阶段,可以对三个过程分别独立建模,使得对目标语言端句子的生成过程进行更为精确的控制成为可能。该采用基于依存边的转换保留了更多的知识,可以容忍更高程度的句法非同构现象,而且取得超过当前主流的基于短语模型翻译的方法的性能。
-
-
-
-
-
-
-