一种混合语音识别方法、系统、计算机设备和存储介质

发明公开

CN118486295A 一种混合语音识别方法、系统、计算机设备和存储介质审中-实审

请登陆查看更多内容

专利标题： 一种混合语音识别方法、系统、计算机设备和存储介质
申请号： CN202410623310.2

申请日： 2024-05-20
公开(公告)号： CN118486295A

公开(公告)日： 2024-08-13
发明人: 刘娟 , 苏立伟 , 康峰 , 马喆非 , 刘振华 , 吴石松 , 梁寿愚 , 王帅 , 余恒祥 , 谭火超 , 陈宋 , 张立慧 , 黄荣达 , 吴海波 , 伍广斌 , 李紫京
申请人： 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
申请人地址： 广东省广州市越秀区东风东路757号;
专利权人： 广东电网有限责任公司,广东电网有限责任公司客户服务中心
当前专利权人： 广东电网有限责任公司,广东电网有限责任公司客户服务中心
当前专利权人地址： 广东省广州市越秀区东风东路757号;
代理机构： 广州三环专利商标代理有限公司
代理商 姚舜禹
主分类号： G10L15/00
IPC分类号： G10L15/00 ; G10L15/02 ; G10L15/06 ; G10L15/22 ; G10L15/26

摘要：

本发明公开了一种混合语音识别方法、系统、计算机设备和存储介质，包括根据第一单语种语音数据和第二单语种语音数据，建立第一单语种模型和第二单语种模型；将第一单语种语音数据和第二单语种语音数据进行拼接，得到混合语种数据，并根据混合语种数据，建立语种分类特征提取模型；将第一单语种模型、第二单语种模型和语种分类特征提取模型进行融合，得到混合语音识别模型；将待识别的混合语音数据输入混合语音识别模型，得到语音识别结果。本发明通过融合汉语、粤语单语种模型和语种分类特征提取模型的特征，构建了混合语音识别模型，能够自动识别输入语音的语种，并综合不同语种模型提供的特征进行识别，有效提高了语音识别的准确性和鲁棒性。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）