-
公开(公告)号:CN117198267A
公开(公告)日:2023-12-08
申请号:CN202311019795.6
申请日:2023-08-14
Applicant: 西安电子科技大学
IPC: G10L15/00 , G10L15/06 , G10L15/16 , G06F16/33 , G06F16/332 , G06F16/338 , G06N3/0464 , G06N3/048 , G06N3/0455 , G06N3/08 , G06F40/42
Abstract: 一种地方方言语音智能识别与问答方法、系统、设备及介质,WeNet2.0为普通话语音识别模型M1;获取地方方言文本翻译任务训练样本集R;Transformer模型为地方方言文本翻译模型M2;将R输入M2中,对M2迭代训练,得到地方方言文本翻译模型M2';将用户测试方言音频输入M1,得到的中间文本向量输入M2'中,得到普通话文本;将普通话文本输入可定制检索式问答模型,若普通话文本与Q1和Q2匹配度计算后命中问答知识库,输出对应答复文本,否则将普通话文本输入生成式大语言模型,生成答复文本;将答复文本输入TTS模型,得到对应的音频;系统、设备及介质:用于实现该方法;本发明解决了地方方言语音识别方法识别准确率低的问题。