-
公开(公告)号:CN117437929A
公开(公告)日:2024-01-23
申请号:CN202311768706.8
申请日:2023-12-21
Applicant: 睿云联(厦门)网络通讯技术有限公司
IPC: G10L21/0208 , G10L25/30 , G06N3/0442 , G06N3/048 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于神经网络的实时回声消除方法,包括:步骤1、构建回声消除模型;步骤2、对所述回声消除模型进行训练;步骤3、构建回声检测模型;步骤4、对所述回声检测模型进行训练;步骤5、将近端音频信号和远端音频信号作为训练后的所述回声消除模型的输入,得到训练后的所述回声消除模型的输出;步骤6、将训练后的所述回声消除模型的输出和远端音频信号作为训练后的所述回声检测模型的输入,得到训练后的所述回声检测模型的输出作为回声检测的标签;步骤7、根据所述回声检测的标签判断当前回声消除模型输出帧的状态,得到最终的目标音频。本发明是结合回声消除模型和回声检测模型,在只采集少量数据的情况下,提高回声消除模型的效果,减小模型的部署难度。
-
公开(公告)号:CN117437929B
公开(公告)日:2024-03-08
申请号:CN202311768706.8
申请日:2023-12-21
Applicant: 睿云联(厦门)网络通讯技术有限公司
IPC: G10L21/0208 , G10L25/30 , G06N3/0442 , G06N3/048 , G06N3/0464 , G06N3/08
-
公开(公告)号:CN115565542A
公开(公告)日:2023-01-03
申请号:CN202211179065.8
申请日:2022-09-27
Applicant: 睿云联(厦门)网络通讯技术有限公司
IPC: G10L21/0208 , G10L21/0224 , G10L25/30
Abstract: 本发明公开了一种基于纯时域信息的实时语音去噪方法和装置以及设备。其中,所述方法包括:提供一GRU神经网络,该GRU神经网络模拟频域音频信号的处理过程对输入的时域音频信号进行时域音频信号提取、预处理、特征提取、信号重建;该GRU神经网络的训练流程包括:获取原始带噪时域语音信号,时域语音信号时域长度为5秒及以上;对该原始带噪时域语音信号进行预处理生成若干语音帧;将若干语音帧输入GRU神经网络训练输出降噪后的语音帧;对若干降噪后的语音帧进行重建生成去噪时域语音信号;利用该去噪时域语音信号计算误差,利用误差控制GRU神经网络收敛得网络参数,再利用该网络参数对GRU神经网络重构。本发明能够在降低算法复杂度的同时保证去噪的效果。
-
-