- 专利标题: 语音识别的声学模型训练方法、系统、设备及介质
-
申请号: CN202010749271.2申请日: 2020-07-30
-
公开(公告)号: CN111883110B公开(公告)日: 2024-02-06
- 发明人: 李明 , 江文斌 , 李健
- 申请人: 上海携旅信息技术有限公司
- 申请人地址: 上海市嘉定区金园一路1331号401室-4
- 专利权人: 上海携旅信息技术有限公司
- 当前专利权人: 上海携旅信息技术有限公司
- 当前专利权人地址: 上海市嘉定区金园一路1331号401室-4
- 代理机构: 上海弼兴律师事务所
- 代理商 杨东明; 刘潇
- 主分类号: G10L15/06
- IPC分类号: G10L15/06 ; G10L15/04 ; G10L15/26
摘要:
本发明公开了一种语音识别的声学模型训练方法、系统、设备及介质,获取训练样本,将第一语音片段分别输入多个预设的不同的基准语音识别模型中进行识别,以获取多个识别文本,计算每两个识别文本间的相似度值,以确定第一语音片段对应的文本得分,判断文本得分是否大于预设阈值,若是,则将文本得分对应的第一语音片段筛选出来,以作为第三语音片段,基于第三语音片段和第二语音片段训练生成语音识别模型。本发明解决了人工标注训练数据集费时费力,无法在短时间形成大量训练数据集,造成语音识别的字错率高的缺陷,提高了语音识别模型识别的准确性。
公开/授权文献
- CN111883110A 语音识别的声学模型训练方法、系统、设备及介质 公开/授权日:2020-11-03