-
公开(公告)号:CN117198274A
公开(公告)日:2023-12-08
申请号:CN202311163637.8
申请日:2023-09-11
Applicant: 辽宁大学
Abstract: 一种基于注意力机制的端到端语音识别模型和外部语言模型的集成方法,属于语音识别技术领域。具体包括以下步骤:1、将待训练的纯文本数据集输入至外部语言模型进行训练生成外部语言模型;2、将对齐的语音、文本数据集输入至基于注意力机制的端到端语音识别模型进行训练生成语音识别模型;3、将用于训练的语音识别模型的纯文本数据集再次放入独立出语音识别模型的解码器中进行训练得到一个预测好的内部语言模型;4、对所述外部语言模型、语音识别模型和预测好的内部语言模型的得分进行集成并进行解码得到语音识别结果。本发明可以极大改善集成模型的准确率,在语音识别领域有着极高的应用前景。