-
公开(公告)号:CN117351946B
公开(公告)日:2024-10-25
申请号:CN202311413996.4
申请日:2023-10-27
Applicant: 之江实验室
IPC: G10L15/06 , G10L15/183 , G10L15/26 , G10L19/04
Abstract: 本说明书公开了一种语音识别方法、装置、存储介质及电子设备。在本说明书提供的语音识别方法中,获取样本文本;将所述样本文本输入待训练的双向语言模型,所述双向语言模型至少包括前向预测子网、后向预测子网、融合子网;通过所述前向预测子网根据所述样本文本得到前向预测结果,并通过所述后向预测子网根据所述样本文本得到后向预测结果;通过所述融合子网对所述前向预测结果和所述后向预测结果进行融合,得到双向预测结果;根据所述双向预测结果和所述样本文本之间的差异,对所述双向语言模型进行训练;采用所述双向语言模型对语音识别模型进行知识迁移;采用知识迁移后的语音识别模型进行语音识别。
-
公开(公告)号:CN117351946A
公开(公告)日:2024-01-05
申请号:CN202311413996.4
申请日:2023-10-27
Applicant: 之江实验室
IPC: G10L15/06 , G10L15/183 , G10L15/26 , G10L19/04
Abstract: 本说明书公开了一种语音识别方法、装置、存储介质及电子设备。在本说明书提供的语音识别方法中,获取样本文本;将所述样本文本输入待训练的双向语言模型,所述双向语言模型至少包括前向预测子网、后向预测子网、融合子网;通过所述前向预测子网根据所述样本文本得到前向预测结果,并通过所述后向预测子网根据所述样本文本得到后向预测结果;通过所述融合子网对所述前向预测结果和所述后向预测结果进行融合,得到双向预测结果;根据所述双向预测结果和所述样本文本之间的差异,对所述双向语言模型进行训练;采用所述双向语言模型对语音识别模型进行知识迁移;采用知识迁移后的语音识别模型进行语音识别。
-
公开(公告)号:CN117219055A
公开(公告)日:2023-12-12
申请号:CN202311423804.8
申请日:2023-10-27
Applicant: 之江实验室
IPC: G10L13/10 , G10L13/027 , G10L25/03 , G10L25/90
Abstract: 本说明书公开了一种基于音色分离的语音生成方法、装置、介质及设备。所述方法包括:获取目标文本以及目标对象的参考语音;将目标文本输入预先训练的语义特征提取模型,以通过语义表征模型,确定目标文本对应的语义特征,以及,将参考语音输入预先训练的语音风格提取模型,以通过语音风格提取模型,确定参考语音对应的语音风格特征;将语义特征以及语音风格特征输入预先训练的语音生成模型,以通过语音生成模型,根据语义特征,将目标文本转换为具有语音风格特征所对应的语音风格信息的目标语音。
-
-