-
公开(公告)号:CN119832896A
公开(公告)日:2025-04-15
申请号:CN202411938659.1
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
IPC: G10L15/02 , G10L15/06 , G10L25/30 , G10L25/03 , G06F18/213 , G06F18/214 , G06F18/25
Abstract: 本申请公开了一种语音识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标语音并提取其目标声学特征;然后将该目标声学特征输入至预先构建的语音识别模型,识别得到目标语音的语音热词识别结果;其中,语音识别模型包括音频编码器、热词编码器和解码器;解码器包括热词混合专家适配器和注意力机制网络。由于本申请是先基于适配器,利用样本语音数据及其对应的文本标注结果和样本热词文本,对端到端语音识别大模型进行训练生成了语音识别模型,不仅提高了模型训练效率并降低了训练成本,而且也有效提高了模型的识别准确度,这样,利用该语音识别模型对目标语音进行语音热词识别时,可以有效提高识别结果的效率和准确率。