- 专利标题: 模型训练、语音识别方法及装置、电子设备及存储介质
-
申请号: CN202110235852.9申请日: 2021-03-03
-
公开(公告)号: CN112599117B公开(公告)日: 2021-05-07
- 发明人: 徐高鹏 , 李成飞 , 杨嵩
- 申请人: 北京世纪好未来教育科技有限公司
- 申请人地址: 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
- 专利权人: 北京世纪好未来教育科技有限公司
- 当前专利权人: 北京世纪好未来教育科技有限公司
- 当前专利权人地址: 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
- 代理机构: 北京合智同创知识产权代理有限公司
- 代理商 李杰; 兰淑铎
- 主分类号: G10L15/06
- IPC分类号: G10L15/06 ; G10L15/07 ; G10L15/02 ; G10L15/22 ; G10L15/26
摘要:
本申请实施例提供了一种模型训练、语音识别方法及装置、电子设备及存储介质,涉及语音识别技术领域,模型训练方法包括:获取第一对象和第二对象分别对应的多个样本语音数据,以及样本语音数据对应的文本信息和身份信息;对样本语音数据进行编码处理,得到声学特征信息;对声学特征信息进行特征提取和预测处理,得到对应的身份特征信息和预测身份信息;对声学特征信息和身份特征信息进行解码处理,得到第一预测文本信息;基于预测身份信息和身份信息确定身份损失值;以及基于第一预测文本信息和文本信息确定文本损失值;根据身份损失值和文本损失值确定目标损失值,并基于目标损失值对语音识别模型进行训练。本申请可以提高语音识别的准确性。
公开/授权文献
- CN112599117A 模型训练、语音识别方法及装置、电子设备及存储介质 公开/授权日:2021-04-02