-
公开(公告)号:CN115515010B
公开(公告)日:2025-03-04
申请号:CN202110634095.2
申请日:2021-06-07
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/44 , H04N21/433 , H04N21/845
Abstract: 本申请公开了一种视频数据处理方法、装置和设备及计算机存储介质,用于降低视频播放的卡顿,提升视频播放的平滑度。该方法包括:视频接收端接收视频发送端发送的视频流,并将视频流的各个视频帧存储至帧缓存区;当帧缓存区已存储第k个视频帧的完整数据时,基于最近一次更新后的发送时间估计器状态,以及第k个视频帧的发送时间测量值,确定第k个视频帧对应的发送时间估计器状态;基于第k个视频帧对应的发送时间估计器状态,确定第k个视频帧对应的发送时间平滑值;基于第k个视频帧对应的发送时间平滑值,确定第k个视频帧的估计渲染时间;基于估计渲染时间,从帧缓存区中读取第k个视频帧,并对第k个视频帧进行渲染处理。
-
公开(公告)号:CN118430559A
公开(公告)日:2024-08-02
申请号:CN202310101784.6
申请日:2023-02-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L21/0216
Abstract: 本申请公开了一种音频共享方法、装置、终端、存储介质及程序产品,涉及通信技术领域。该方法包括:在开启音频共享功能的情况下,获取终端播放的第一音频,第一音频是终端中除音频共享应用之外的其他应用播放的音频,音频共享应用用于将终端播放的音频共享给其他终端,第一音频的获取过程未经过麦克风采集链路;获取经过回声消除后得到的第二音频,回声消除用于消除麦克风采集音频中包含的终端播放的音频;对第一音频和第二音频进行音频混合,得到第三音频,第三音频用于共享给其他终端。该方法可以提高共享音频的音频质量。
-
公开(公告)号:CN117651096B
公开(公告)日:2024-04-19
申请号:CN202410120919.8
申请日:2024-01-29
Applicant: 腾讯科技(深圳)有限公司
IPC: H04M9/08 , G10L21/0208 , G10L21/0216
Abstract: 本申请公开了一种回声消除方法、装置、电子设备及存储介质。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。该方法包括:分别对近端语音信号以及近端语音信号对应的远端语音信号进行移频处理以及下采样处理,得到远端语音信号对应的目标远端复信号以及近端语音信号对应的目标近端复信号;根据目标远端复信号以及目标近端复信号,确定近端语音信号与远端语音信号之间的互相关函数;根据互相关函数,确定回声信号的回声延迟;基于回声信号的回声延迟,对近端语音信号进行回声消除。通过本申请的方法,实现了近端语音信号的回声消除。
-
公开(公告)号:CN116978397A
公开(公告)日:2023-10-31
申请号:CN202211485214.3
申请日:2022-11-24
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0216 , G10L21/0208
Abstract: 本申请公开了一种延迟估计方法,包括:将参考信号输入至目标滤波器进行线性卷积,得到估计信号,参考信号为经分块处理后的远端输入信号;根据估计信号和期望信号确定误差信号,期望信号为近端输入信号和回声信号组成;基于误差信号对目标滤波器进行权重迭代更新,直至目标滤波器满足收敛条件;获取满足收敛条件的目标滤波器中的目标回声信道;根据目标回声信道对应的响应能量,确定目标延迟。本申请应用目标滤波器进行回声信道的估计,并基于该回声信道进行延迟估计,通过目标滤波器具有的鲁棒性可以提高算法收敛的稳定性,降低算法的计算量,从而提高延迟估计的性能和效率。
-
公开(公告)号:CN116566963B
公开(公告)日:2023-10-13
申请号:CN202310850039.1
申请日:2023-07-12
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及多媒体技术领域,尤其涉及一种音频处理方法、装置、电子设备和存储介质,用以降低音频处理的资源耗费。其中,方法包括:基于承载应用程序的终端设备的配置信息,获得各初始音频信号各自对应的处理模式;分别基于各初始音频信号各自的处理模式,对初始音频信号进行处理,获得各目标音频信号,其中,输入音频信号经处理后,获得的目标音频信号为采集音频信号,输出音频信号经处理后获得的目标音频信号为共享音频信号;对各目标音频信号进行混音,并对混音后音频进行编码,获得待发送编码信号。本申请通过基于配置信息获得初始音频信号的处理模式,实现不同终端设备之间的音频共享,对处理后的音频信号混音后编码,节省计算资源。
-
公开(公告)号:CN115515010A
公开(公告)日:2022-12-23
申请号:CN202110634095.2
申请日:2021-06-07
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/44 , H04N21/433 , H04N21/845
Abstract: 本申请公开了一种视频数据处理方法、装置和设备及计算机存储介质,用于降低视频播放的卡顿,提升视频播放的平滑度。该方法包括:视频接收端接收视频发送端发送的视频流,并将视频流的各个视频帧存储至帧缓存区;当帧缓存区已存储第k个视频帧的完整数据时,基于最近一次更新后的发送时间估计器状态,以及第k个视频帧的发送时间测量值,确定第k个视频帧对应的发送时间估计器状态;基于第k个视频帧对应的发送时间估计器状态,确定第k个视频帧对应的发送时间平滑值;基于第k个视频帧对应的发送时间平滑值,确定第k个视频帧的估计渲染时间;基于估计渲染时间,从帧缓存区中读取第k个视频帧,并对第k个视频帧进行渲染处理。
-
公开(公告)号:CN117061465A
公开(公告)日:2023-11-14
申请号:CN202210485771.9
申请日:2022-05-06
Applicant: 腾讯科技(深圳)有限公司
IPC: H04L49/9005 , H04L43/087 , H04L43/0852
Abstract: 本公开实施例公开了一种音频数据处理方法、装置、设备及存储介质,涉及计算机技术领域,该方法包括:接收音频数据的当前音频帧,该音频数据的内容为用户语音或音乐;根据当前音频帧的发送时间和接收时间获得当前网络延迟指标;根据当前网络延迟指标确定当前实际存储容量;根据发送时间和接收时间获得当前网络抖动瞬时指标;根据当前网络抖动瞬时指标获得当前网络抖动指标;根据当前网络抖动指标确定当前目标存储容量;缓存当前音频帧;根据当前实际存储容量和当前目标存储容量,处理缓存区中的音频帧。采用本公开,可以根据当前网络延迟指标和当前网络抖动指标自适应地调节缓存区的当前实际存储容量和当前目标存储容量,提高音频数据的处理质量。
-
公开(公告)号:CN118248160B
公开(公告)日:2024-08-06
申请号:CN202410620986.6
申请日:2024-05-20
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L25/21
Abstract: 本申请实施例公开一种音频处理方法、装置、设备及介质。通过将接收到的远端信号与接收到的近端输入信号对齐,得到对齐后的目标远端信号;根据目标远端信号对近端输入信号中的回声信号进行线性滤波处理,得到输出信号;根据目标远端信号和输出信号,确定出输出信号中线性滤波后的第一残留回声信号的第一功率谱密度;根据目标远端信号对应的回声估计信号的历史功率谱密度的分布,确定输出信号中未经过线性滤波处理的第二残留回声信号的第二功率谱密度;根据输出信号的功率谱密度、第一功率谱密度和第二功率谱密度确定出输出信号的增益参数,并根据增益参数对输出信号进行增益,得到输出到远端的目标输出信号。以此来提升语音通信的信号质量。
-
公开(公告)号:CN118248160A
公开(公告)日:2024-06-25
申请号:CN202410620986.6
申请日:2024-05-20
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L25/21
Abstract: 本申请实施例公开一种音频处理方法、装置、设备及介质。通过将接收到的远端信号与接收到的近端输入信号对齐,得到对齐后的目标远端信号;根据目标远端信号对近端输入信号中的回声信号进行线性滤波处理,得到输出信号;根据目标远端信号和输出信号,确定出输出信号中线性滤波后的第一残留回声信号的第一功率谱密度;根据目标远端信号对应的回声估计信号的历史功率谱密度的分布,确定输出信号中未经过线性滤波处理的第二残留回声信号的第二功率谱密度;根据输出信号的功率谱密度、第一功率谱密度和第二功率谱密度确定出输出信号的增益参数,并根据增益参数对输出信号进行增益,得到输出到远端的目标输出信号。以此来提升语音通信的信号质量。
-
公开(公告)号:CN117651096A
公开(公告)日:2024-03-05
申请号:CN202410120919.8
申请日:2024-01-29
Applicant: 腾讯科技(深圳)有限公司
IPC: H04M9/08 , G10L21/0208 , G10L21/0216
Abstract: 本申请公开了一种回声消除方法、装置、电子设备及存储介质。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。该方法包括:分别对近端语音信号以及近端语音信号对应的远端语音信号进行移频处理以及下采样处理,得到远端语音信号对应的目标远端复信号以及近端语音信号对应的目标近端复信号;根据目标远端复信号以及目标近端复信号,确定近端语音信号与远端语音信号之间的互相关函数;根据互相关函数,确定回声信号的回声延迟;基于回声信号的回声延迟,对近端语音信号进行回声消除。通过本申请的方法,实现了近端语音信号的回声消除。
-
-
-
-
-
-
-
-
-