-
公开(公告)号:CN118887948A
公开(公告)日:2024-11-01
申请号:CN202411053578.3
申请日:2024-08-02
申请人: 广西民族大学
摘要: 本发明提供一种基于伪标签生成和模型迁移的壮语语音识别方法,包括两个步骤:第一步,进行声学模型的训练,包括IPA伪标签数据的生成以及声学模型的训练;第二步,语音识别系统的训练,包括声学模型的迁移,以及基于注意力机制的编码器解码器架构的语音识别模型的训练。本发明通过借助伪标签生成的方法,解决了大量无标注壮语音频数据无法充分利用的问题,并以此来训练声学模型。再通过声学模型迁移的方法,解决少量有标注数据难以训练可用壮语语音识别模型的问题。