-
公开(公告)号:CN120015048A
公开(公告)日:2025-05-16
申请号:CN202510153631.5
申请日:2025-02-12
Applicant: 上海交通大学
IPC: G10L21/0232 , G10L25/18 , G10L25/30
Abstract: 本发明公开一种面向鲁棒语音识别的非侵入式的增强语音失真抑制方法,所述方法包括如下步骤:S1:输入原始复数频谱和增强复数频谱;S2:依据所述步骤S1中的输入获取失真抑制系数;S3:将所述失真抑制系数应用于失真抑制插值算法获取输出修正频谱。本发明通过使用非侵入式的前后端桥接模块,实现计算量小,且可与现有的流式、非流式语音增强模型兼容;增强模型训练需求数据量小,可在少量有标注数据上完成快速适应;不改变增强模型的输出信号,有效保持了不同增强算法对增强语音不同方面的听感增益。
-
公开(公告)号:CN119517059A
公开(公告)日:2025-02-25
申请号:CN202411649456.0
申请日:2024-11-18
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于帧重采样和子带剪枝的轻量化语音增强方法,涉及自动语音识别领域。本发明提出的层级帧重采样(Layer‑Wise Frame Resampling,LWS)与子带剪枝(Sub‑Band Pruning,SBP)方法,能够在提升语音增强模型效率的同时,确保在复杂噪声环境中的语音识别性能。本发明具备高度的实用性,可根据具体应用场景的需求进行灵活调整,尤其适合在工业界对实时推理延迟、计算资源有限的端侧设备和语音识别场景中部署。
-