语音增强方法、计算机设备及存储介质

    公开(公告)号:CN114299916B

    公开(公告)日:2025-04-04

    申请号:CN202111677651.0

    申请日:2021-12-31

    Inventor: 赵力 黄继昆

    Abstract: 本申请涉及语音处理技术领域,并公开了一种语音增强方法、计算机设备及存储介质,通过提取目标场景中的语音信号,将语音信号中的第一声学特征信号输入训练完毕的的语音增强模型中进行语音增强,得到第一目标声学特征信号后,将第一目标声学特征信号和第一声学特征信号的相位进行合成,得到目标语音信号;由于训练完毕的的语音增强模型包括预设数量的短时记忆模块,预设数量的短时记忆模块堆叠成具有堆叠结构的网络结构,而具有堆叠结构的网络结构的损失函数包括频域损失部分、信号约束损失部分和跨域约束损失部分,经训练完毕的的语音增强模型对第一声学特征信息进行语音增强,不仅能够抑制或消除平稳噪声以及非平稳噪声,同时能够抑制或消除冲击噪声。

    声场分区控制方法、装置、车载扬声器和存储介质

    公开(公告)号:CN119767223A

    公开(公告)日:2025-04-04

    申请号:CN202411681195.0

    申请日:2024-11-22

    Abstract: 本发明涉及音频降噪技术领域,提供一种声场分区控制方法、装置、车载扬声器和存储介质,其中方法包括:获取扬声器到各声场分区的传递函数信号;基于所述传递函数信号和神经网络模型,得到所述扬声器在所述各声场分区分别作为明暗区时对应的滤波器参数;基于所述各声场分区下明暗区声场能量之间的差异,对所述神经网络模型进行参数迭代,所述明暗区声场能量基于所述传递函数信号和所述滤波器参数确定,参数迭代完成后的神经网络模型用于确定待控制扬声器的声场分区滤波器参数。本发明提供的声场分区控制方法、装置、车载扬声器和存储介质,实现了从用户听感的角度针对性的提高了多明区环境下的隔离度体验。

    语音增强方法、计算机设备及存储介质

    公开(公告)号:CN114299916A

    公开(公告)日:2022-04-08

    申请号:CN202111677651.0

    申请日:2021-12-31

    Inventor: 赵力 黄继昆

    Abstract: 本申请涉及语音处理技术领域,并公开了一种语音增强方法、计算机设备及存储介质,通过提取目标场景中的语音信号,将语音信号中的第一声学特征信号输入训练完毕的的语音增强模型中进行语音增强,得到第一目标声学特征信号后,将第一目标声学特征信号和第一声学特征信号的相位进行合成,得到目标语音信号;由于训练完毕的的语音增强模型包括预设数量的短时记忆模块,预设数量的短时记忆模块堆叠成具有堆叠结构的网络结构,而具有堆叠结构的网络结构的损失函数包括频域损失部分、信号约束损失部分和跨域约束损失部分,经训练完毕的的语音增强模型对第一声学特征信息进行语音增强,不仅能够抑制或消除平稳噪声以及非平稳噪声,同时能够抑制或消除冲击噪声。

Patent Agency Ranking