发明公开
- 专利标题: 一种混合语音识别方法、系统、计算机设备和存储介质
-
申请号: CN202410623310.2申请日: 2024-05-20
-
公开(公告)号: CN118486295A公开(公告)日: 2024-08-13
- 发明人: 刘娟 , 苏立伟 , 康峰 , 马喆非 , 刘振华 , 吴石松 , 梁寿愚 , 王帅 , 余恒祥 , 谭火超 , 陈宋 , 张立慧 , 黄荣达 , 吴海波 , 伍广斌 , 李紫京
- 申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
- 申请人地址: 广东省广州市越秀区东风东路757号;
- 专利权人: 广东电网有限责任公司,广东电网有限责任公司客户服务中心
- 当前专利权人: 广东电网有限责任公司,广东电网有限责任公司客户服务中心
- 当前专利权人地址: 广东省广州市越秀区东风东路757号;
- 代理机构: 广州三环专利商标代理有限公司
- 代理商 姚舜禹
- 主分类号: G10L15/00
- IPC分类号: G10L15/00 ; G10L15/02 ; G10L15/06 ; G10L15/22 ; G10L15/26
摘要:
本发明公开了一种混合语音识别方法、系统、计算机设备和存储介质,包括根据第一单语种语音数据和第二单语种语音数据,建立第一单语种模型和第二单语种模型;将第一单语种语音数据和第二单语种语音数据进行拼接,得到混合语种数据,并根据混合语种数据,建立语种分类特征提取模型;将第一单语种模型、第二单语种模型和语种分类特征提取模型进行融合,得到混合语音识别模型;将待识别的混合语音数据输入混合语音识别模型,得到语音识别结果。本发明通过融合汉语、粤语单语种模型和语种分类特征提取模型的特征,构建了混合语音识别模型,能够自动识别输入语音的语种,并综合不同语种模型提供的特征进行识别,有效提高了语音识别的准确性和鲁棒性。