-
公开(公告)号:CN112668345B
公开(公告)日:2024-06-04
申请号:CN202011552924.4
申请日:2020-12-24
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/42 , G06F40/216 , G06F40/253 , G06N3/0442 , G06N3/08
Abstract: 本申请公开了一种语法缺陷数据识别模型构建方法和语法缺陷数据识别方法,该构建方法包括:在获取到第一训练源文本、第一标准翻译文本及其对应的第一实际识别结果、和第一语法缺陷翻译文本及其对应的第二实际识别结果后,将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型,得到第一标准翻译文本对应的第一预测识别结果和第一语法缺陷翻译文本对应的第二预测识别结果;再根据第一预测识别结果、第二预测识别结果、第一实际识别结果和第二实际识别结果更新第一模型,并返回执行将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型的步骤,直至在达到第一停止条件时根据第一模型构建语法缺陷数据识别模型。
-
公开(公告)号:CN112686059B
公开(公告)日:2024-04-16
申请号:CN202011593142.5
申请日:2020-12-29
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种文本翻译方法、装置、电子设备和存储介质,其中方法包括:确定源语言文本,以及与源语言文本相匹配的翻译文本对;将源语言文本以及翻译文本对输入至机器翻译模型,得到机器翻译模型输出的目标语言文本;机器翻译模型是基于样本源语言文本、与样本源语言文本相匹配的样本翻译文本对,以及样本源语言文本的样本目标语言文本训练得到的。本发明提供的方法、装置、电子设备和存储介质,机器翻译模型能够将翻译文本对的信息作为对源语言文本进行翻译的参考,从而优化翻译效果。且无需重新对机器翻译模型进行迭代优化,且当实际场景发生变化时,仅需累积实际场景变化后的翻译文本对即可保证机器翻译及时满足场景变化需求。
-
公开(公告)号:CN113723116B
公开(公告)日:2024-02-13
申请号:CN202110982411.5
申请日:2021-08-25
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Inventor: 张为泰
Abstract: 本申请公开了一种文本翻译方法及相关装置、电子设备、存储介质,其中,文本翻译方法包括:获取待翻译文本和若干参考文本;其中,待翻译文本以源语种表示,待翻译文本中含有多义词,若干参考文本以目标语种表示,且各个参考文本中均含有多义词的释义词语;提取待翻译文本中多义词的第一语义表示,并分别提取各个参考文本中释义词语的第二语义表示;基于第一语义表示和第二语义表示的聚类结果,获取多义词在待翻译文本中以目标语种释义的翻译词语;基于翻译词语对待翻译文本进行翻译,得到以目标语种表示的翻译文本。上述方案,能够提高翻译准确性。
-
公开(公告)号:CN113221884A
公开(公告)日:2021-08-06
申请号:CN202110522161.7
申请日:2021-05-13
Applicant: 中国科学技术大学
Abstract: 本发明涉及一种基于低频字存储记忆的文本识别方法及系统,其方法包括:S1:统计训练集中低频字;S2:将待识别的文本行图像进行预处理后,将其输入卷积神经网络以及循环神经网络,获得序列特征;S3:根据序列特征和低频字,利用带注意力机制的解码器,分别获得序列特征的上下文信息和低频字的关联特征;S4:将序列特征的上下文信息与低频字关联特征分别经过一个门控机制,获得各自的置信度;将二者的置信度进行融合,得到文本行图像的识别结果。本发明提供的方法,在识别过程中不仅使用了文本图像的上下文信息,还利用注意力机制将低频字的关联特征引入到每一帧的文字识别中,引入门控机制以防止低频字的关联特征对非低频字的识别造成干扰。
-
公开(公告)号:CN113204978A
公开(公告)日:2021-08-03
申请号:CN202110523435.4
申请日:2021-05-13
Applicant: 中国科学技术大学
IPC: G06F40/58 , G06F40/211 , G06F40/216 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种机器翻译增强训练方法及系统,其方法包括:S1:获取训练数据,训练数据包括:源端句子和目标端句子;S2:分别使用源端句子和目标端句子训练源端语言模型和目标端语言模型;S3:随机选择源端句子中子词,并根据源端句子构造移位后的句子,输入源端语言模型,对移位后的句子中对应的子词进行预测,根据预测结果进行加权求和,实现对源端句子的增强;S4:根据源端句子和目标端句子的注意力权重分布,并根据源端句子中子词替换目标端句子中对应子词,利用语言模型和神经机器翻译模型联合预测结果,以实现对目标端句子的增强。本发明通过对平行训练数据进行加噪和增强,从而提升低资源条件下神经机器翻译模型的训练效果和鲁棒性。
-
公开(公告)号:CN115062633B
公开(公告)日:2025-05-13
申请号:CN202210688236.3
申请日:2022-06-16
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/30 , G06F40/289
Abstract: 本发明提供一种平行句对构建方法、装置、电子设备和存储介质,其中方法包括:获取第一语句和第二语句,第一语句和第二语句对应不同语种;基于跨语种语言模型,确定第一语句的第一语义特征和第二语句的第二语义特征,跨语种语言模型是基于第一样本语句中各分词与第二样本语句中各分词之间的词义关系训练得到的,第一样本语句和第二样本语句对应不同语种;基于第一语义特征和第二语义特征之间的相似度,构建平行句对,本发明实施例中,应用不同语种的样本语句各自包含的分词之间的词义关系,进行模型训练,能够使训练所得的模型性能更优,在面向稀缺资源语言时,提升了句子嵌入的准确度,精进了平行句对的构建过程,实现了平行句对构建质量的提升。
-
公开(公告)号:CN114201975B
公开(公告)日:2024-04-12
申请号:CN202111250312.4
申请日:2021-10-26
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种翻译模型训练方法和翻译方法及其装置。其中,模型训练方法包括:分别将平行双语句对中的源语言语句和加噪的源语言语句输入翻译模型,得到第一预测目标语言语句和第二预测目标语言语句,并分别获取翻译模型的第一预测概率分布、第二预测概率分布和/或各隐藏层输出的第一特征向量、第二特征向量;基于第一预测目标语言语句与平行双语句对中的目标语言语句、第二预测目标语言语句与加噪的源语言语句对应的目标语言语句、第一特征向量与第二特征向量和/或第一预测概率分布与第二预测概率分布,确定翻译模型的当前训练损失,调整翻译模型的参数。本发明实施例可以提升翻译模型的鲁棒性,并且训练方法简单,模型训练稳定。
-
公开(公告)号:CN113609875B
公开(公告)日:2024-02-20
申请号:CN202110901225.4
申请日:2021-08-06
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/289 , G06F40/30 , G06N3/0455 , G06N3/084
Abstract: 本发明提供一种翻译质量评估方法、装置、电子设备和存储介质,其中方法包括:确定原文文本及其对应的待评估译文文本;对所述待评估译文文本进行句级别翻译质量评估,得到句级评估结果;所述句级评估结果包括所述待评估译文文本的语义忠实度和/或语义流利度;对所述待评估译文文本进行词级别翻译质量评估,得到词级评估结果;所述词级评估结果包括所述待评估译文文本中各个分词的翻译准确度和/或对齐匹配度;基于所述句级评估结果和所述词级评估结果,确定所述待评估译文文本的质量评估结果。本发明提高了翻译质量评估的准确性。
-
公开(公告)号:CN115952808A
公开(公告)日:2023-04-11
申请号:CN202211640692.7
申请日:2022-12-20
Applicant: 中国科学技术大学
IPC: G06F40/51 , G06F40/189 , G06F40/30 , G06N3/0455 , G06N3/048
Abstract: 本发明公开一种多语种机器翻译质量评估方法、模型、设备及存储介质,方法包括:步骤1,利用预训练好的多语言语义编码器对给定平行句对的源语言和目标语言进行同一语义编码;步骤2,利用预先经层次化半监督质量评估训练及质量评估正反一致性联合训练好的多语种机器翻译质量评估模型对同一语义编码通过交叉注意力层来进行源与目标语言交互;步骤3,对交叉注意力层的输出通过全连接层进行信息交互和非线性化激活在CLS标签位置经sigmoid函数处理,以处理结果作为质量评估结果。通过用多语言语义编码统一建模,同时建模质量评估与多语言语种间相似性;用训练好的质量评估模型,解决了资源稀缺场景下模型可用性问题,也提高了评估效果一致性。
-
公开(公告)号:CN113221884B
公开(公告)日:2022-09-06
申请号:CN202110522161.7
申请日:2021-05-13
Applicant: 中国科学技术大学
Abstract: 本发明涉及一种基于低频字存储记忆的文本识别方法及系统,其方法包括:S1:统计训练集中低频字;S2:将待识别的文本行图像进行预处理后,将其输入卷积神经网络以及循环神经网络,获得序列特征;S3:根据序列特征和低频字,利用带注意力机制的解码器,分别获得序列特征的上下文信息和低频字的关联特征;S4:将序列特征的上下文信息与低频字关联特征分别经过一个门控机制,获得各自的置信度;将二者的置信度进行融合,得到文本行图像的识别结果。本发明提供的方法,在识别过程中不仅使用了文本图像的上下文信息,还利用注意力机制将低频字的关联特征引入到每一帧的文字识别中,引入门控机制以防止低频字的关联特征对非低频字的识别造成干扰。
-
-
-
-
-
-
-
-
-