-
公开(公告)号:CN119864047A
公开(公告)日:2025-04-22
申请号:CN202411781377.5
申请日:2024-12-05
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0272 , G10L15/06 , G10L17/04
Abstract: 本申请公开了一种音频分离方法、系统和相关装置,该方法包括:获取待分离音频;将所述待分离音频输入至训练后的目标分离模型,得到第一子音频和第二子音频;其中,所述目标分离模型是利用多个目标训练样本进行训练得到的,所述目标训练样本是基于多个初始训练音频以及与多个音轨类别分别匹配的候选声部确定的,所述初始训练音频包括与多个音轨类别分别匹配的参考声部,所述候选声部用于对所述初始训练音频中的至少一个所述参考声部进行替换。通过上述方式,本申请能够提高音频分离的准确性。
-
公开(公告)号:CN119943072A
公开(公告)日:2025-05-06
申请号:CN202510086727.4
申请日:2025-01-20
Applicant: 科大讯飞股份有限公司
IPC: G10L21/02 , G10L21/0216 , H04R3/02
Abstract: 本申请提供一种语音增强方法、装置、设备、介质及程序产品,该语音增强方法包括:对麦克风接收信号进行语音增强,获得第一增强信号;对第一增强信号中低频段的信号进行语音增强,获得第二增强信号;基于第一增强信号和第二增强信号,确定目标增强信号;对目标增强信号进行扩音,得到扩音后的信号。本申请能够降低扩音环境中啸叫发生概率。
-
公开(公告)号:CN119724218A
公开(公告)日:2025-03-28
申请号:CN202411647499.5
申请日:2024-11-18
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0272 , G10L17/02 , G10L17/04
Abstract: 本发明提供一种人声分离方法、装置、设备及介质,其中方法包括:获取混合人声信号,以及获取所述混合人声信号中包含的各单人人声信号的声纹特征;基于所述混合人声信号的声学特征和所述各单人人声信号的声纹特征,对所述混合人声信号进行人声分离,得到多个单人人声信号。本发明提供的人声分离方法、装置、设备及介质,通过引入单人人声信号的声纹特征提升了人声分离的精度。通过结合声纹特征,使得即使在声音频率分布重叠的情况下,也能在复杂场景下获得清晰、独立的单人人声信号。
-
-