音素提取方法、语音识别方法、装置、设备及存储介质

    公开(公告)号:CN113838456A

    公开(公告)日:2021-12-24

    申请号:CN202111141351.0

    申请日:2021-09-28

    Inventor: 方昕 刘俊华

    Abstract: 本申请提出一种音素提取方法、语音识别方法、装置、电子设备及存储介质,该方法包括:根据待识别语音的当前待识别语音单元的声学特征,以及所述待识别语音的已识别语音单元的识别结果,预测与所述当前待识别语音单元对应的音素序列;至少根据所述当前待识别语音单元对应的音素序列,对所述当前待识别语音单元进行语音识别,得到对应所述当前待识别语音单元的语音识别结果。采用上述的技术方案,能够显著提高端侧离线语音识别的识别效果。

    一种声纹模型训练的方法和系统

    公开(公告)号:CN109378003B

    公开(公告)日:2021-10-01

    申请号:CN201811302005.4

    申请日:2018-11-02

    Inventor: 方昕 刘俊华 魏思

    Abstract: 本发明实施例提供了一种声纹模型训练方法和系统,该方法包括:选取多个用户标识下的语音作为训练语音;根据训练语音确定初始声纹模型;利用初始声纹模型对每个用户标识下的训练语音进行聚类,得到排序后的训练语音;将排序后每个用户标识下的训练语音划分成第一子集、第二子集和第三子集;将所有用户标识下的第一子集合并为第一训练子集,第二子集合并为第二训练子集,以及第三子集合并为第三训练子集;按照从易到难的学习顺序依次对第一训练子集、第二训练子集和第三训练子集进行学习,得到最终的声纹模型。本发明实施例有效提高了声纹模型的鲁棒性,使声纹系统的性能更加优越。

    交互式语音翻译方法及装置

    公开(公告)号:CN108304389B

    公开(公告)日:2021-06-08

    申请号:CN201711287987.X

    申请日:2017-12-07

    Abstract: 本发明实施例提供一种交互式语音翻译方法及装置,属于语言处理技术领域。该方法包括:若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行翻译,得到第二识别文本;若第一识别文本与第二识别文本之间语义不等价,则提示用户第一识别文本对应的翻译难易程度;若检测到用户输入关键文本,则对关键文本进行语义解析,以得到关键名词及关键名词的类型,并基于关键名词的类型对关键名词进行翻译,得到第一翻译结果,对其它内容进行翻译,得到第二翻译结果,将第一翻译结果与第二翻译结果合并得到第二目标语言文本。由于提供了一种新的语音翻译交互模式,以使得翻译结果更加准确。

    发音词典生成方法及装置、存储介质、电子设备

    公开(公告)号:CN107767858B

    公开(公告)日:2021-05-04

    申请号:CN201710805626.3

    申请日:2017-09-08

    Abstract: 本公开提供一种发音词典生成方法及装置、存储介质、电子设备。该方法包括:获取待确定发音词语对应的语音片段,并针对所述待确定发音词语构建发音识别网络,所述发音识别网络中包括所述待确定发音词语的正确发音单元以及音变发音单元;利用所述发音识别网络对所述语音片段进行解码,确定出所述语音片段对应的发音路径,所述发音路径由所述正确发音单元和/或所述音变发音单元构成;计算所述发音路径表示的发音的置信度,并利用置信度高于预设值的发音路径表示的发音,生成所述待确定发音词语的发音词典。如此方案,可以使生成的发音词典更符合用户的实际发音,准确性更高。

    文本翻译方法、装置、电子设备和存储介质

    公开(公告)号:CN112686060A

    公开(公告)日:2021-04-20

    申请号:CN202011593186.8

    申请日:2020-12-29

    Abstract: 本发明提供一种文本翻译方法、装置、电子设备和存储介质,其中方法包括:确定源语言文本及其所属领域;将源语言文本输入至所属领域对应的领域机器翻译模型中,得到领域机器翻译模型输出的目标语言文本;领域机器翻译模型是基于对应领域下的样本源语言文本及其样本目标语言文本训练得到的;领域机器翻译模型用于基于源语言文本在所属领域和通用场景下的文本特征,进行文本翻译。本发明提供的方法、装置、电子设备和存储介质,结合特定领域和通用场景下的文本特征进行机器翻译,在提升特定领域文本的翻译效果的同时,保障通用场景文本的翻译效果不下降,从而避免由于领域分类错误导致的文本翻译效果大幅下降的问题。

    翻译模型训练方法、装置、设备及存储介质

    公开(公告)号:CN112560510A

    公开(公告)日:2021-03-26

    申请号:CN202011454443.X

    申请日:2020-12-10

    Abstract: 本申请公开了一种翻译模型训练方法、装置、设备及存储介质,本申请针对源语言和/或目标语言,获取其各自的近似语言下的训练语料,以及训练语料的平行语料,其中,若训练语料的语言与源语言近似,该平行语料是目标语言,若训练语料的语言与目标语言近似,该平行语料是源语言,针对训练语料中至少一文本单元,利用该文本单元在与训练语料近似的源语言或目标语言下的平行文本单元进行替换,得到混合语言训练语料,由混合语言训练语料与平行语料组成平行语料对,以平行语料对加入训练样本集,训练源语言至目标语言的翻译模型。本申请利用了源语言和/或目标语言的近似语言资源,丰富了模型训练数据,提升了翻译模型的训练效果。

    一种标点预测方法、装置、设备及存储介质

    公开(公告)号:CN112347789A

    公开(公告)日:2021-02-09

    申请号:CN202011230897.9

    申请日:2020-11-06

    Abstract: 本申请提供了一种标点预测方法、装置、设备及存储介质,其中,方法包括:获取待预测文本,其中,待预测文本为当前语音片段的当前识别结果;以待预测文本是否为当前语音片段的首个中间识别结果为依据,获取历史预测信息,其中,历史预测信息为,在对历史识别结果进行标点预测的过程中所产生的、用于确定标点预测结果的中间信息;根据历史预测信息和待预测文本预测待预测文本中词的标点信息。本申请提供的标点预测方法具有较高的预测准确度和预测效率,该优势使得本申请提供的标点预测方法能够适用于机器同声传译场景。

    文本分类方法、相关设备及可读存储介质

    公开(公告)号:CN111460149A

    公开(公告)日:2020-07-28

    申请号:CN202010230887.9

    申请日:2020-03-27

    Abstract: 本申请公开了一种文本分类方法、相关设备及可读存储介质,首先,获取待分类文本,及预置的待测类别对应的类别文本;再确定由每一类别文本和所述待分类文本组成的文本对的文本语义信息;然后,针对每一文本对,基于该文本对的文本语义信息,确定该文本对是否匹配;最后,将匹配的文本对中的类别文本对应的待测类别作为所述待分类文本的类别。基于上述方案,能够将海量的文本划分为不同的类别,得到文本类别的划分结果,基于文本类别的划分结果,可以将不同类别下的文本推荐到相应人员,从而帮助用户在海量文本中选择出有价值的文本。

    文本翻译处理方法及装置
    79.
    发明授权

    公开(公告)号:CN108228574B

    公开(公告)日:2020-07-28

    申请号:CN201711288979.7

    申请日:2017-12-07

    Abstract: 本发明实施例提供一种文本翻译处理方法及装置,属于语言处理技术领域。该方法包括:若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行翻译,得到第二识别文本;若第一识别文本与第二识别文本之间语义不等价,获取关键名词及关键名词的类型;基于关键名词的类型对关键名词进行翻译,得到第一翻译结果,对第一识别文本中除关键名词之外的其它内容进行翻译,得到第二翻译结果,将第一翻译结果与第二翻译结果进行合并得到第二目标语言文本。由于可将第一识别文本中的关键名词作为一个整体分词,按照关键名词类型对关键名词进行翻译,从而可使得翻译结果更加准确。

    文本翻译方法及装置
    80.
    发明授权

    公开(公告)号:CN108170686B

    公开(公告)日:2020-02-14

    申请号:CN201711480227.0

    申请日:2017-12-29

    Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:获取源文本对应的音素序列编码向量及词序列向量;其中,源文本对应的音素序列编码向量中包含的音素编码向量数与源文本对应的词序列向量中包含的词向量数相同;将源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到源文本对应的目标文本。由于在机器翻译的解码阶段之前,结合了词序列和音素序列进行编码,从而可利用音素序列对语音识别结果作容错处理,使得翻译后的目标文本能够更加准确地对应源语音信号。因此,翻译结果更加准确。

Patent Agency Ranking