-
公开(公告)号:CN117014556A
公开(公告)日:2023-11-07
申请号:CN202211361655.2
申请日:2022-11-02
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种啸叫检测方法、装置及计算机可读存储介质,方法通过对待检测的通话语音进行语音帧采样,得到待检测语音帧;将待检测语音帧的时域信号转换为相应的频谱信号;对频谱信号进行频带划分,并对划分得到的每个频带进行能量检测,得到每个频带的频带能量;基于相邻频带的频带能量之间的比对结果确定待检测语音帧的语音帧特征;根据语音帧特征与历史语音帧特征之间的比对结果,确定对待检测语音帧的啸叫检测结果。该方法可以提升啸叫检测的效率,进而可以实现实时的啸叫检测,从而可以提升通话体验。
-
公开(公告)号:CN116978397A
公开(公告)日:2023-10-31
申请号:CN202211485214.3
申请日:2022-11-24
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L21/0216 , G10L21/0208
摘要: 本申请公开了一种延迟估计方法,包括:将参考信号输入至目标滤波器进行线性卷积,得到估计信号,参考信号为经分块处理后的远端输入信号;根据估计信号和期望信号确定误差信号,期望信号为近端输入信号和回声信号组成;基于误差信号对目标滤波器进行权重迭代更新,直至目标滤波器满足收敛条件;获取满足收敛条件的目标滤波器中的目标回声信道;根据目标回声信道对应的响应能量,确定目标延迟。本申请应用目标滤波器进行回声信道的估计,并基于该回声信道进行延迟估计,通过目标滤波器具有的鲁棒性可以提高算法收敛的稳定性,降低算法的计算量,从而提高延迟估计的性能和效率。
-
公开(公告)号:CN116566963B
公开(公告)日:2023-10-13
申请号:CN202310850039.1
申请日:2023-07-12
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请涉及多媒体技术领域,尤其涉及一种音频处理方法、装置、电子设备和存储介质,用以降低音频处理的资源耗费。其中,方法包括:基于承载应用程序的终端设备的配置信息,获得各初始音频信号各自对应的处理模式;分别基于各初始音频信号各自的处理模式,对初始音频信号进行处理,获得各目标音频信号,其中,输入音频信号经处理后,获得的目标音频信号为采集音频信号,输出音频信号经处理后获得的目标音频信号为共享音频信号;对各目标音频信号进行混音,并对混音后音频进行编码,获得待发送编码信号。本申请通过基于配置信息获得初始音频信号的处理模式,实现不同终端设备之间的音频共享,对处理后的音频信号混音后编码,节省计算资源。
-
公开(公告)号:CN115550459A
公开(公告)日:2022-12-30
申请号:CN202110725190.3
申请日:2021-06-29
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种语音数据的发送和接收方法以及相关设备;可以获取待编码数据序列;针对待编码数据序列中每个语音数据,确定所述语音数据的关联语音数据;对所述语音数据和其对应的关联语音数据进行冗余编码,得到编码后数据序列,所述编码后数据序列包括多个具有时序关系的编码后语音数据包,编码后语音数据包包括载荷字段和冗余字段,载荷字段包含所述语音数据,冗余字段包含压缩后的关联语音数据;按照预定顺序向网络侧发送所述编码后数据序列中的语音数据包。本申请既能保证传输网络的抗丢包能力,又可以有效提升网络带宽的利用率。
-
公开(公告)号:CN110364166B
公开(公告)日:2022-10-28
申请号:CN201910744527.8
申请日:2018-06-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L15/26 , G10L21/0216
摘要: 本申请涉及一种实现语音信号识别的电子设备,包括:用于采集音频信号的麦克风阵列;与麦克风阵列连接的多个处理器;各处理器配对配置有波束形成器和语音识别模块,其中,各波束形成器,用于将音频信号在设定的多个不同目标方向分别进行波束成形处理,得到对应的多路波束信号;各语音识别模块,用于分别对配对的各波束形成器输出的波束信号进行语音识别,得到各路波束信号的语音识别结果;其中一个处理器配置有处理模块,用于根据各路波束信号的语音识别结果,确定音频信号的语音识别结果。该方法通过在不同目标方向进行波束成形处理,那么至少一个目标方向与语音信号产生方向接近,能够提高智能语音识别的准确度。
-
公开(公告)号:CN114822569A
公开(公告)日:2022-07-29
申请号:CN202110081032.9
申请日:2021-01-21
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L21/0208 , G10L21/0232 , G10L25/24 , G10L25/30 , H04L65/60 , H04L65/80
摘要: 本申请提供了一种音频信号处理方法、装置、设备及计算机可读存储介质;方法包括:获取待处理的音频信号;对所述音频信号进行频带分解,得到第一频带信号和第二频带信号,所述第一频带信号的频率低于所述第二频带信号的频率;确定第一频带信号对应的第一信号增益,基于所述第一信号增益确定第二频带信号对应的第二信号增益;基于所述第一信号增益和所述第一频带信号确定处理后的第一频带信号,基于所述第二信号增益和所述第二频带信号确定处理后的第二频带信号;对所述处理后的第一频带信号和所述处理后的第二频带信号进行频带合成,得到处理后的音频信号。通过本申请,能够提高语音处理效率。
-
公开(公告)号:CN114727194A
公开(公告)日:2022-07-08
申请号:CN202110002583.1
申请日:2021-01-04
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请实施例提供一种麦克风音量控制方法、装置、设备及存储介质。方法包括:对麦克风采集的语音信号进行语音检测,得到与语音信号对应的至少两种环境指标;采用与每一环境指标对应的语音信号处理方式,分别对语音信号进行语音信号预处理,对应得到至少两个语音信号流;对每一语音信号流进行参数特征提取,得到所述语音信号的至少两个参数状态流;根据所述至少两个参数状态流,分别确定所述麦克风的数字增益调整量和模拟增益调整量;并对应调整所述麦克风的数字增益和模拟增益。通过本申请,能够灵活的根据麦克风当前所处环境的环境指标,适应性的对麦克风进行灵活的数字增益和模型增益调整,使得麦克风音量更加平滑,提高用户体验。
-
公开(公告)号:CN114333749A
公开(公告)日:2022-04-12
申请号:CN202011062254.8
申请日:2020-09-30
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10K11/178
摘要: 本申请涉及一种啸叫抑制方法、装置、计算机设备和存储介质。所述方法包括:获取当前时间段对应的当前音频信号,将当前音频信号进行频域变换,得到频域音频信号;对频域音频信号进行划分,得到各个子带,从各个子带中确定目标子带;获取当前音频信号对应的当前啸叫检测结果和当前语音检测结果,基于当前啸叫检测结果和当前语音检测结果确定当前音频信号对应的子带增益系数;获取历史时间段的音频信号对应的历史子带增益,基于子带增益系数和历史子带增益计算当前音频信号对应的当前子带增益;基于当前子带增益对目标子带进行啸叫抑制,得到当前时间段对应的第一目标音频信号。采用本方法提高了啸叫抑制的准确性。
-
公开(公告)号:CN110491403B
公开(公告)日:2022-03-04
申请号:CN201910741369.0
申请日:2018-11-30
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0224 , G10L21/0232 , G10L25/51 , G01S3/802
摘要: 本申请揭示了一种音频信号的处理方法、装置、介质和音频交互设备。所述方法包括:获取音频信号;在音频交互设备中获取回声参考信号,通过所述回声参考信号对麦克风采集的所述音频信号进行线性回声消除;在所述音频信号消回声之后进行时频分析,获得消回声后音频信号的时频域表达。本申请实施例的技术方案可以有效消除音频信号中的回声信号,以实现对音频信号的预处理。
-
公开(公告)号:CN113823313A
公开(公告)日:2021-12-21
申请号:CN202110783691.7
申请日:2021-07-12
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L21/0232 , G10L25/84 , G10L15/02 , G10L15/04
摘要: 本申请公开了一种语音处理方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,在进行语音降噪时,无需通过结构复杂的模型进行噪声识别,直接基于语音数据的频域信息确定一个第一掩码,将第一掩码与语音数据的频谱结合,就能够得到目标语音数据,在保证降噪效果的同时,提高了语音降噪的速度,减少了计算资源的消耗。
-
-
-
-
-
-
-
-
-