-
公开(公告)号:CN119864048A
公开(公告)日:2025-04-22
申请号:CN202411763274.6
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音处理方法、电子设备和存储介质。该方法包括获取多通道语音数据;对所述多通道语音数据进行处理,得到空间特征和谱特征;对所述空间特征进行时频建模,得到空间时频特征,并对所述谱特征进行时频建模,得到谱时频特征;对所述空间时频特征和所述谱时频特征进行融合并解码,得到掩膜信息,其中所述掩膜信息用于从所述多通道语音数据中分离出目标语音数据。本申请提高了目标语音的识别效率。
-
公开(公告)号:CN118629415A
公开(公告)日:2024-09-10
申请号:CN202410847651.8
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/30 , G10H1/36
Abstract: 本发明提供一种音频信号处理方法、装置、车载娱乐系统、电子设备和存储介质,方法包括:获取参考信号和麦克风的输入信号;将参考信号经过分块频域滤波器处理,得到估计信号,并基于估计信号和输入信号,得到误差信号;采用非对称分析窗对误差信号进行加窗运算,得到加窗误差信号;对加窗误差信号进行基于频域掩码的降噪处理,得到目标信号,并通过扬声器播放目标信号。本发明提供的音频信号处理方法、装置、车载娱乐系统、电子设备和存储介质,通过分块频域滤波器处理和基于频域掩码的降噪处理,能够精确消除扬声器到麦克风的反馈语音和环境噪声,只保留目标说话人语音,从而有效防止啸叫的产生,提高了目标信号的质量。
-