-
公开(公告)号:CN112802444B
公开(公告)日:2023-07-25
申请号:CN202011607966.3
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音合成方法、装置、设备及存储介质,本申请在对待合成的原始文本进行语音合成的过程中,参考了与原始文本存在相匹配的文本片段的匹配文本对应的辅助合成特征,该辅助合成特征为基于匹配文本对应的发音音频所确定的用于辅助语音合成的特征,本申请通过参考匹配文本对应的辅助合成特征,可以利用匹配文本对应的发音音频中发音信息辅助对原始文本进行语音合成,丰富了原始文本语音合成时所参考的信息,进而提高了原始文本的语音合成质量。本申请方案可以适用于带前端预处理和不带前端预处理两种类型的语音合成系统,辅助合成特征可以作为前端文本分析结果也可以直接辅助语音合成系统进行语音合成,均能够提高合成语音的质量。
-
公开(公告)号:CN108228576B
公开(公告)日:2021-07-02
申请号:CN201711488585.6
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:基于源文本的特征向量及每种聚类类别对应的聚类中心特征向量,确定源文本所属的聚类类别;将源文本所属的聚类类别进行向量化,得到源文本对应的聚类类别向量,将源文本中分词的词向量与源文本对应的聚类类别向量进行整合,将整合结果输入至翻译模型,输出至少一个候选目标文本及每个候选目标文本对应的翻译分值;基于每个候选目标文本的翻译分值,从所有候选目标文本中选取一个候选目标文本作为源文本的翻译结果。由于在翻译过程中可结合源文本的整体语义及其它翻译隐藏参考要素对源文本进行翻译。因此,提高了翻译模型的领域鲁棒性及翻译准确度。
-
公开(公告)号:CN107886940A
公开(公告)日:2018-04-06
申请号:CN201711107222.3
申请日:2017-11-10
Applicant: 科大讯飞股份有限公司
CPC classification number: G10L15/005 , G06F17/2827 , G06F17/289 , G10L15/02 , G10L15/26
Abstract: 本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括:若判断获知上一轮次的第一语音信号与当前轮次待翻译的第二语音信号均对应相同的语种类型,则基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整,得到第二语音信号对应调整后的文本数据;获取调整后的文本数据对应的合成语音信号,并播报合成语音信号。由于上一轮次的第一语音信号与当前轮次待翻译的第二语音信号在内容上可能是有关联的,从而基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整,可使得翻译结果会更加切合场景且更加精准。
-
-
公开(公告)号:CN108228574A
公开(公告)日:2018-06-29
申请号:CN201711288979.7
申请日:2017-12-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译处理方法及装置,属于语言处理技术领域。该方法包括:若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行翻译,得到第二识别文本;若第一识别文本与第二识别文本之间语义不等价,获取关键名词及关键名词的类型;基于关键名词的类型对关键名词进行翻译,得到第一翻译结果,对第一识别文本中除关键名词之外的其它内容进行翻译,得到第二翻译结果,将第一翻译结果与第二翻译结果进行合并得到第二目标语言文本。由于可将第一识别文本中的关键名词作为一个整体分词,按照关键名词类型对关键名词进行翻译,从而可使得翻译结果更加准确。
-
公开(公告)号:CN107977364A
公开(公告)日:2018-05-01
申请号:CN201711489210.1
申请日:2017-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本发明实施例提供一种维语子词切分方法及装置,属于机器翻译技术领域。该方法包括:根据目标维语词语的词向量及目标维语词语中每一字母的字母向量,确定目标维语词语中每一字母对应的标签;根据目标维语词语中每一字母对应的标签,分别确定目标维语词语中词干的边界字母与词缀的边界字母;根据目标维语词语中词干的边界字母确定目标维语词语中的词干,根据目标维语词语中词缀的边界字母确定目标维语词语中的词缀。由于不需要预先进行大量人工标注及归纳工作,从而切分更为便捷且效率更高。另外,由于不需要依赖词干、词缀列表及切分规则,只需基于目标维语词语的词向量及目标维语词语中每一字母的字母向量,即可进行切分,从而适用范围更广。
-
公开(公告)号:CN107910004A
公开(公告)日:2018-04-13
申请号:CN201711107221.9
申请日:2017-11-10
Applicant: 科大讯飞股份有限公司
CPC classification number: G10L15/26 , G06F17/289 , G10L13/04 , G10L15/22
Abstract: 本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括:在对第一合成语音信号进行播报的过程中,若接收到包含有部分第一合成语音信号的混合语音信号,则停止播报第一合成语音信号。从混合语音信号过滤掉部分第一合成语音信号,得到当前轮次待翻译的语音信号,并作为目标语音信号。基于目标语音信号,获取第二合成语音信号,并播报第二合成语音信号。本发明实施例在接收到包含有部分第一合成语音信号的混合语音信号时,停止播报第一合成语音信号,并播报第二合成语音信号。由于沟通过程中的任意一方,均可按照全双工模式随时打断播报过程,而不用每次都等到一轮播报过程结束,从而可提高沟通效率。
-
公开(公告)号:CN107977364B
公开(公告)日:2022-02-25
申请号:CN201711489210.1
申请日:2017-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F40/289 , G06F16/35
-
公开(公告)号:CN108304389B
公开(公告)日:2021-06-08
申请号:CN201711287987.X
申请日:2017-12-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种交互式语音翻译方法及装置,属于语言处理技术领域。该方法包括:若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行翻译,得到第二识别文本;若第一识别文本与第二识别文本之间语义不等价,则提示用户第一识别文本对应的翻译难易程度;若检测到用户输入关键文本,则对关键文本进行语义解析,以得到关键名词及关键名词的类型,并基于关键名词的类型对关键名词进行翻译,得到第一翻译结果,对其它内容进行翻译,得到第二翻译结果,将第一翻译结果与第二翻译结果合并得到第二目标语言文本。由于提供了一种新的语音翻译交互模式,以使得翻译结果更加准确。
-
公开(公告)号:CN112802444A
公开(公告)日:2021-05-14
申请号:CN202011607966.3
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音合成方法、装置、设备及存储介质,本申请在对待合成的原始文本进行语音合成的过程中,参考了与原始文本存在相匹配的文本片段的匹配文本对应的辅助合成特征,该辅助合成特征为基于匹配文本对应的发音音频所确定的用于辅助语音合成的特征,本申请通过参考匹配文本对应的辅助合成特征,可以利用匹配文本对应的发音音频中发音信息辅助对原始文本进行语音合成,丰富了原始文本语音合成时所参考的信息,进而提高了原始文本的语音合成质量。本申请方案可以适用于带前端预处理和不带前端预处理两种类型的语音合成系统,辅助合成特征可以作为前端文本分析结果也可以直接辅助语音合成系统进行语音合成,均能够提高合成语音的质量。
-
-
-
-
-
-
-
-
-