-
公开(公告)号:CN113707166B
公开(公告)日:2024-06-07
申请号:CN202110371804.2
申请日:2021-04-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L25/30
Abstract: 本申请涉及一种语音信号处理方法、装置、计算机设备和存储介质。该方法涉及数据库,具体包括:接收参考语音信号,对参考语音信号进行信道解码;参考语音信号是由远端设备采集原始语音信号并经过信道编码后传输的;远端设备与目标设备处于不同的位置空间且远端设备的扬声器保持关闭状态;播放解码后的参考语音信号,并采集播放的参考语音信号得到回声信号;基于回声信号构建目标设备对应的训练样本集;该训练样本集可以存储在数据库中;训练样本集用于训练得到目标设备对应的目标回声消除模型;目标回声消除模型用于对目标设备采集的双讲语音信号进行非线性回声消除处理。采用本方法能够提高回声消除模型的泛化性能。
-
公开(公告)号:CN113707166A
公开(公告)日:2021-11-26
申请号:CN202110371804.2
申请日:2021-04-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208 , G10L25/30
Abstract: 本申请涉及一种语音信号处理方法、装置、计算机设备和存储介质。该方法涉及数据库,具体包括:接收参考语音信号,对参考语音信号进行信道解码;参考语音信号是由远端设备采集原始语音信号并经过信道编码后传输的;远端设备与目标设备处于不同的位置空间且远端设备的扬声器保持关闭状态;播放解码后的参考语音信号,并采集播放的参考语音信号得到回声信号;基于回声信号构建目标设备对应的训练样本集;该训练样本集可以存储在数据库中;训练样本集用于训练得到目标设备对应的目标回声消除模型;目标回声消除模型用于对目标设备采集的双讲语音信号进行非线性回声消除处理。采用本方法能够提高回声消除模型的泛化性能。
-
公开(公告)号:CN111478905A
公开(公告)日:2020-07-31
申请号:CN202010270145.9
申请日:2020-04-08
Applicant: 腾讯科技(深圳)有限公司
IPC: H04L29/06
Abstract: 本申请涉及通讯技术领域,公开了一种通信数据的获取方法、装置、电子设备及存储介质,通信数据的获取方法,包括:接收多人会话中的与会者发起的子会话构建请求,构建请求包括:子会话的构建参数、子会话参与者的标识信息以及子会话等级;响应子会话构建请求,按照构建参数及子会话参与者的标识信息构建子会话;将多人会话中除所述子会话参与者之外的、权限高于所述子会话等级的与会者确定为第一与会者;当接收到第一与会者发送的针对所述子会话的通信数据获取请求时,将所述子会话的通信数据发送给所述第一与会者,以及将第一与会者的通信数据发送给所述子会话中的各个子会话参与者。本申请提供的方案,能够实现对子会话内容及进程的控制。
-
公开(公告)号:CN111478905B
公开(公告)日:2023-03-24
申请号:CN202010270145.9
申请日:2020-04-08
Applicant: 腾讯科技(深圳)有限公司
IPC: H04L65/403 , H04L65/1069 , H04L65/1066 , H04L65/1083 , H04L65/75
Abstract: 本申请涉及通讯技术领域,公开了一种通信数据的获取方法、装置、电子设备及存储介质,通信数据的获取方法,包括:接收多人会话中的与会者发起的子会话构建请求,构建请求包括:子会话的构建参数、子会话参与者的标识信息以及子会话等级;响应子会话构建请求,按照构建参数及子会话参与者的标识信息构建子会话;将多人会话中除所述子会话参与者之外的、权限高于所述子会话等级的与会者确定为第一与会者;当接收到第一与会者发送的针对所述子会话的通信数据获取请求时,将所述子会话的通信数据发送给所述第一与会者,以及将第一与会者的通信数据发送给所述子会话中的各个子会话参与者。本申请提供的方案,能够实现对子会话内容及进程的控制。
-
公开(公告)号:CN113571078B
公开(公告)日:2024-04-26
申请号:CN202110129579.1
申请日:2021-01-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0232
Abstract: 本公开提供了一种噪声抑制方法、装置、介质以及电子设备。该方法包括:获取原始语音信号的低频频谱特征和高频频谱特征,并对低频频谱特征和高频频谱特征进行特征组合处理得到频带能量特征;在原始语音信号中确定当前帧语音信号和上一帧语音信号,并对当前帧语音信号和上一帧语音信号进行线性域变换处理得到频谱特征参数;对频谱特征参数和频带能量特征进行相关性计算得到倒谱特征,并对倒谱特征进行降维映射处理得到降维特征;对降维特征和倒谱特征进行特征融合处理得到增益信息,并对增益信息进行噪声抑制处理得到原始语音信号的降噪语音信号。本公开保证了关键噪声种类的噪声抑制效果和效率,极大地降低了噪声抑制的复杂度。
-
公开(公告)号:CN116962791A
公开(公告)日:2023-10-27
申请号:CN202310987467.9
申请日:2023-08-07
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/431 , H04N21/472
Abstract: 本申请涉及互联网技术领域,提供了一种视频播放方法、装置、设备及存储介质,用以在视频播放时,既不影响观感又能准确显示剧中人物之间的人物关系。本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。该方法包括:呈现视频播放界面,视频播放界面中包含目标视频;目标视频包括至少一个剧情阶段;在视频播放界面当前播放的视频画面中包括多个人物时,响应于针对视频画面中至少两个目标人物的选择操作,在剧情显示界面内,显示在视频画面所属的目标剧情阶段,至少两个目标人物各自对应的身份信息;在剧情显示界面内,进一步显示在目标剧情阶段,至少两个目标人物之间的人物关系。
-
公开(公告)号:CN113571081A
公开(公告)日:2021-10-29
申请号:CN202110182834.9
申请日:2021-02-08
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0264 , G10L21/0208
Abstract: 本申请涉及语音处理技术领域,具体提供了一种语音增强方法、装置、设备及存储介质,该包括:根据目标语音帧对应的幅度谱对所述目标语音帧进行预增强处理,得到第一幅度谱;根据所述第一幅度谱对所述目标语音帧进行语音分解,得到所述目标语音帧对应的声门参数、增益和激励信号;根据所述声门参数、所述增益和所述激励信号进行合成处理,得到所述目标语音帧对应的增强语音信号;本申请的方案可以有效对语音进行增强,该方案可以应用于云会议中。
-
公开(公告)号:CN110602327B
公开(公告)日:2021-06-25
申请号:CN201910906728.3
申请日:2019-09-24
Applicant: 腾讯科技(深圳)有限公司
IPC: H04M1/72454
Abstract: 本申请提供了一种语音通话方法、装置、电子设备及计算机可读存储介质,该方法包括:获取终端系统历史时刻的语音通话状态,终端系统上设置有至少两个音频采集设备;获取各音频采集设备在当前时刻采集到的第一语音信号,并分别确定各第一语音信号的信号能量;基于历史时刻的语音通话状态、以及各第一语音信号的信号能量,从各音频采集设备中确定当前时刻的目标音频采集设备。该方案中目标音频采集设备确定过程中不是仅依赖于各音频采集设备采集到的语音信号的信号能量或近端设备的通话场景,因此避免了现有技术中确定出的目标音频采集设备所采集到的语音信号中回声较大或近端语音较小的问题,提高了语音通话的效果。
-
公开(公告)号:CN110602327A
公开(公告)日:2019-12-20
申请号:CN201910906728.3
申请日:2019-09-24
Applicant: 腾讯科技(深圳)有限公司
IPC: H04M1/725
Abstract: 本申请提供了一种语音通话方法、装置、电子设备及计算机可读存储介质,该方法包括:获取终端系统历史时刻的语音通话状态,终端系统上设置有至少两个音频采集设备;获取各音频采集设备在当前时刻采集到的第一语音信号,并分别确定各第一语音信号的信号能量;基于历史时刻的语音通话状态、以及各第一语音信号的信号能量,从各音频采集设备中确定当前时刻的目标音频采集设备。该方案中目标音频采集设备确定过程中不是仅依赖于各音频采集设备采集到的语音信号的信号能量或近端设备的通话场景,因此避免了现有技术中确定出的目标音频采集设备所采集到的语音信号中回声较大或近端语音较小的问题,提高了语音通话的效果。
-
公开(公告)号:CN116189697A
公开(公告)日:2023-05-30
申请号:CN202111424702.9
申请日:2021-11-26
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/02 , G10L21/0208
Abstract: 本申请公开一种多通道回声消除方法和相关装置,获取多个通道输出的多个远端音频信号,以及获取第k帧麦克风信号对应的第一滤波器系数矩阵。根据多个远端音频信号进行分帧分块处理,确定第k帧麦克风信号对应的远端频域信号矩阵,远端频域信号矩阵包括每个通道分别对应的滤波器子块的远端频域信号。根据第一滤波器系数矩阵和远端频域信号矩阵进行滤波处理,得到第k帧麦克风信号中的回声信号,之后根据第k帧麦克风信号的频域信号和第k帧麦克风信号中的回声信号进行回声消除,得到目标麦克风输出的近端音频信号。该方案降低回声路径等原因带来的延时,并且大大简化多通道回声消除的计算量和计算复杂度,以及获得更好的收敛性能。
-
-
-
-
-
-
-
-
-