-
公开(公告)号:CN119596237A
公开(公告)日:2025-03-11
申请号:CN202411728528.0
申请日:2024-11-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种声源定位方法、声音识别方法、声源定位装置、声源识别装置、电子设备及计算机可读存储介质,该声源定位方法包括:获取第一数量路候选声音信号的质量参数,第一数量路候选声音信号分别由麦克风阵列中第一数量个麦克风采集;从第一数量路候选声音信号中,选择质量参数满足质量参数关系的第二数量路目标声音信号;基于各路目标声音信号进行声源定位,得到声源定位结果。上述方案,能够灵活应用于各种声源定位环境,且能够提升声源定位结果的准确度。
-
公开(公告)号:CN119943071A
公开(公告)日:2025-05-06
申请号:CN202510063415.1
申请日:2025-01-15
Applicant: 科大讯飞股份有限公司
IPC: G10L21/02 , G10L21/0208 , G10L25/03 , G10L25/24 , G10L25/30
Abstract: 本申请提供一种语音交互方法、装置、设备、介质及程序产品,该语音交互方法包括:确定第一原始信号的第一置信度和第一语音增强信号的第二置信度;其中,第一语音增强信号是对第一原始信号进行语音增强后得到的信号;基于第一置信度、第二置信度、第二原始信号和第二语音增强信号,确定目标信号;其中,第二语音增强信号是对第二原始信号进行语音增强后得到的信号;基于目标信号,与目标设备进行语音交互。本申请能够减小语音增强带来的语音失真。
-