-
公开(公告)号:CN117995211A
公开(公告)日:2024-05-07
申请号:CN202410034667.7
申请日:2024-01-09
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L21/02 , G10L21/0232 , G10L21/0264 , G10L25/30
Abstract: 本发明提供语音交流补偿方法、装置、汽车、电子设备及存储介质,涉及语音增强技术领域,该方法包括:将待处理语音信号输入至自适应反馈抑制模块,得到自适应反馈抑制模块输出的第一中间信号;自适应反馈抑制模块用于去除待处理语音信号中的扬声器信号;将第一中间信号输入至语音增强神经网络,得到语音增强神经网络输出的第二中间信号;语音增强神经网络用于基于第一中间信号对待处理语音信号进行降噪和混响;将第二中间信号输入至随噪补偿模块,得到随噪补偿模块输出的增强语音信号;随噪补偿模块用于根据背景噪声调整第二中间信号的音量。本发明通过传统信号处理方式加神经网络,能够实现低时延的语音交流补偿增强,增强了算法的鲁棒性。
-
公开(公告)号:CN117915237A
公开(公告)日:2024-04-19
申请号:CN202311717964.3
申请日:2023-12-13
Applicant: 科大讯飞股份有限公司
IPC: H04R3/12
Abstract: 本申请公开了一种音频输出方法、装置、设备及存储介质。该方法包括:获取第一用户的入会信息;第一用户为输出第一音频的用户;基于第一用户的入会信息,确定第一音频相对于第二用户的输出方向;基于第一音频的输出方向,将第一音频分配至第二用户所在的空间中位于多个不同位置的扬声器,以通过多个不同位置的扬声器输出第一音频。由于第一音频的输出方向是依据第一用户的入会信息确定的,不同的入会信息可以确定出不同的输出方向。因此,第一音频的输出方向相对于第二用户可以动态变化,且可以来自于空间内多个不同位置的扬声器,因此,可以有效地增强第一音频相对于第二用户的空间感,从而提高第二用户的会议体验,有助于提高会议效果。
-
公开(公告)号:CN118629415A
公开(公告)日:2024-09-10
申请号:CN202410847651.8
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/30 , G10H1/36
Abstract: 本发明提供一种音频信号处理方法、装置、车载娱乐系统、电子设备和存储介质,方法包括:获取参考信号和麦克风的输入信号;将参考信号经过分块频域滤波器处理,得到估计信号,并基于估计信号和输入信号,得到误差信号;采用非对称分析窗对误差信号进行加窗运算,得到加窗误差信号;对加窗误差信号进行基于频域掩码的降噪处理,得到目标信号,并通过扬声器播放目标信号。本发明提供的音频信号处理方法、装置、车载娱乐系统、电子设备和存储介质,通过分块频域滤波器处理和基于频域掩码的降噪处理,能够精确消除扬声器到麦克风的反馈语音和环境噪声,只保留目标说话人语音,从而有效防止啸叫的产生,提高了目标信号的质量。
-
公开(公告)号:CN117958654A
公开(公告)日:2024-05-03
申请号:CN202311360331.1
申请日:2023-10-19
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种清洁机器人及其语音控制方法、装置,机器人顶部设置有定向麦克风阵列,不同定向麦克风的拾音方向不同。定向麦克风具有指向性会抑制麦克风轴向后方的噪声,也即能够抑制机器人底部的主要噪声源,提升了采集的原始语音信号的信噪比。由处理器计算每一定向麦克风采集的原始语音信号在人声所处频段的信号能量,选取信号能量最大的候选原始语音信号,分别检测每一候选原始语音信号是否满足设定语音控制条件,若是,执行条件匹配的动作。借助高信噪比的原始语音信号,可以提升语音唤醒率和命令词识别率。此外,本申请以声学定位为主,可以避免通过摄像头进行人体检测定位在多人场合无法区分真实说话人的弊端。
-
-
-