一种基于信息解耦的跨方言语音识别方法、系统和设备

    公开(公告)号:CN119274540A

    公开(公告)日:2025-01-07

    申请号:CN202411420743.4

    申请日:2024-10-12

    Abstract: 本发明公开了一种基于信息解耦的跨方言语音识别方法、系统和设备,属于语音识别领域。本发明的一种基于信息解耦的跨方言语音识别方法,通过构建信息采集模型、方言解耦模型、方言拼接模型、语音识别模型,将说话人信息从方言发音嵌入中解耦,获得说话人无关的方言发音嵌入,从而可以将说话人信息,语义信息和方言信息解耦,从而避免口音嵌入与其他语音属性交织在一起,因而可以获得更精确的方言特征;同时在方言适配阶段,使用提取的方言发音嵌入帮助模型学习方言语音,因而能够有效提高对多方言的泛化能力,提高识别准确率。进一步,本发明可以有效提取口音嵌入,而无需任何特定说话人的信息,因而可以有效提高跨方言语音识别模型的性能。

Patent Agency Ranking