模型训练、语音识别方法及装置、电子设备及存储介质

发明授权

CN112599117B 模型训练、语音识别方法及装置、电子设备及存储介质有权

请登陆查看更多内容

专利标题： 模型训练、语音识别方法及装置、电子设备及存储介质
申请号： CN202110235852.9

申请日： 2021-03-03
公开(公告)号： CN112599117B

公开(公告)日： 2021-05-07
发明人: 徐高鹏 , 李成飞 , 杨嵩
申请人： 北京世纪好未来教育科技有限公司
申请人地址： 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
专利权人： 北京世纪好未来教育科技有限公司
当前专利权人： 北京世纪好未来教育科技有限公司
当前专利权人地址： 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
代理机构： 北京合智同创知识产权代理有限公司
代理商 李杰; 兰淑铎
主分类号： G10L15/06
IPC分类号： G10L15/06 ; G10L15/07 ; G10L15/02 ; G10L15/22 ; G10L15/26

摘要：

本申请实施例提供了一种模型训练、语音识别方法及装置、电子设备及存储介质，涉及语音识别技术领域，模型训练方法包括：获取第一对象和第二对象分别对应的多个样本语音数据，以及样本语音数据对应的文本信息和身份信息；对样本语音数据进行编码处理，得到声学特征信息；对声学特征信息进行特征提取和预测处理，得到对应的身份特征信息和预测身份信息；对声学特征信息和身份特征信息进行解码处理，得到第一预测文本信息；基于预测身份信息和身份信息确定身份损失值；以及基于第一预测文本信息和文本信息确定文本损失值；根据身份损失值和文本损失值确定目标损失值，并基于目标损失值对语音识别模型进行训练。本申请可以提高语音识别的准确性。

公开/授权文献

CN112599117A 模型训练、语音识别方法及装置、电子设备及存储介质公开/授权日：2021-04-02

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/06	.创建基准模板；训练语音识别系统，例如对说话者声音特征的适应（G10L15/14优先）