基于PESQ驱动的强化学习估计先验信噪比的语音增强方法

    公开(公告)号:CN114141266B

    公开(公告)日:2025-05-06

    申请号:CN202111516319.6

    申请日:2021-12-08

    Applicant: 南京大学

    Inventor: 雷桐 卢晶

    Abstract: 本发明公开了一种基于PESQ驱动的强化学习估计先验信噪比的语音增强方法,具体步骤如下:(1)使用清晰语音和噪声数据集生成模拟含噪语音,并做短时傅里叶变换得到短时傅里叶谱;(2)用清晰语音和含噪语音的短时傅里叶谱训练Deep Xi‑TCN网络;(3)用理想的映射信噪比通过K‑means聚类生成有限个聚类中心,作为先验信噪比模板;(4)正式训练阶段,通过DQN网络在帧层面挑选Deep Xi‑TCN推断的信噪比或者先验信噪比模板,计算出与PESQ值相关的奖励,进行强化学习迭代,更新网络参数;(5)将含噪语音短时傅里叶谱输入完成训练的模型,得到的增强语音的短时傅里叶谱,再进行逆短时傅里叶变换。本发明能进一步优化Deep Xi‑TCN推断的先验信噪比,从而提高与听感相关的语音质量。

    基于PESQ驱动的强化学习估计先验信噪比的语音增强方法

    公开(公告)号:CN114141266A

    公开(公告)日:2022-03-04

    申请号:CN202111516319.6

    申请日:2021-12-08

    Applicant: 南京大学

    Inventor: 雷桐 卢晶

    Abstract: 本发明公开了一种基于PESQ驱动的强化学习估计先验信噪比的语音增强方法,具体步骤如下:(1)使用清晰语音和噪声数据集生成模拟含噪语音,并做短时傅里叶变换得到短时傅里叶谱;(2)用清晰语音和含噪语音的短时傅里叶谱训练Deep Xi‑TCN网络;(3)用理想的映射信噪比通过K‑means聚类生成有限个聚类中心,作为先验信噪比模板;(4)正式训练阶段,通过DQN网络在帧层面挑选Deep Xi‑TCN推断的信噪比或者先验信噪比模板,计算出与PESQ值相关的奖励,进行强化学习迭代,更新网络参数;(5)将含噪语音短时傅里叶谱输入完成训练的模型,得到的增强语音的短时傅里叶谱,再进行逆短时傅里叶变换。本发明能进一步优化Deep Xi‑TCN推断的先验信噪比,从而提高与听感相关的语音质量。

Patent Agency Ranking