模型训练、语音识别方法及装置、电子设备及存储介质
摘要:
本申请实施例提供了一种模型训练、语音识别方法及装置、电子设备及存储介质,涉及语音识别技术领域,模型训练方法包括:获取第一对象和第二对象分别对应的多个样本语音数据,以及样本语音数据对应的文本信息和身份信息;对样本语音数据进行编码处理,得到声学特征信息;对声学特征信息进行特征提取和预测处理,得到对应的身份特征信息和预测身份信息;对声学特征信息和身份特征信息进行解码处理,得到第一预测文本信息;基于预测身份信息和身份信息确定身份损失值;以及基于第一预测文本信息和文本信息确定文本损失值;根据身份损失值和文本损失值确定目标损失值,并基于目标损失值对语音识别模型进行训练。本申请可以提高语音识别的准确性。
0/0