-
公开(公告)号:CN112735417A
公开(公告)日:2021-04-30
申请号:CN202011591155.9
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音翻译方法、电子设备、存储介质。其中,语音翻译方法,包括:在获取待翻译语音数据的过程中对待翻译语音数据进行流式语音识别;对当前流式语音识别进行即时判定,以判定识别的当前识别结果是否触发翻译操作,若是,对当前识别结果进行翻译。其能够降低翻译等待时间,提高翻译效率。
-
公开(公告)号:CN109190134A
公开(公告)日:2019-01-11
申请号:CN201811393972.6
申请日:2018-11-21
Applicant: 科大讯飞股份有限公司
IPC: G06F17/28
Abstract: 本申请公开了一种文本翻译方法及装置,该方法包括:首先,利用预先构建的文本翻译模型对源文本进行翻译,其中,文本翻译模型包括对应于通用领域的一个翻译子模型以及对应于不同特定领域的不同翻译子模型,各个翻译子模型的部分参数共享,然后,可以获取到各个翻译子模型进行翻译后输出的各个目标文本,接着,可以从各个目标文本中选择出源文本的最终翻译文本,可见,本申请在对源文本进行翻译时,通过部分参数共享的各个不同领域的翻译子模型和通用领域的翻译子模型进行翻译,再从所有得到的翻译后的文本中选出最终的翻译文本,不仅能够缩小模型的大小,还能够兼顾通用领域以及其他特定领域的翻译质量,从而可以提高对源文本的翻译质量。
-
公开(公告)号:CN108228576A
公开(公告)日:2018-06-29
申请号:CN201711488585.6
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:基于源文本的特征向量及每种聚类类别对应的聚类中心特征向量,确定源文本所属的聚类类别;将源文本所属的聚类类别进行向量化,得到源文本对应的聚类类别向量,将源文本中分词的词向量与源文本对应的聚类类别向量进行整合,将整合结果输入至翻译模型,输出至少一个候选目标文本及每个候选目标文本对应的翻译分值;基于每个候选目标文本的翻译分值,从所有候选目标文本中选取一个候选目标文本作为源文本的翻译结果。由于在翻译过程中可结合源文本的整体语义及其它翻译隐藏参考要素对源文本进行翻译。因此,提高了翻译模型的领域鲁棒性及翻译准确度。
-
公开(公告)号:CN108170686A
公开(公告)日:2018-06-15
申请号:CN201711480227.0
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06F17/28
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:获取源文本对应的音素序列编码向量及词序列向量;其中,源文本对应的音素序列编码向量中包含的音素编码向量数与源文本对应的词序列向量中包含的词向量数相同;将源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到源文本对应的目标文本。由于在机器翻译的解码阶段之前,结合了词序列和音素序列进行编码,从而可利用音素序列对语音识别结果作容错处理,使得翻译后的目标文本能够更加准确地对应源语音信号。因此,翻译结果更加准确。
-
-
-