-
公开(公告)号:CN113990335B
公开(公告)日:2024-12-31
申请号:CN202111260920.3
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10L19/16
Abstract: 本发明公开了一种基于压缩感知的音频编解码方法,本发明音频编码中的待量化信号类型是压缩感知的稀疏分解后的降维信号,解码输出端需要进行稀疏分解的音频信号重构操作,编解码过程中采用区间能量方式进行自适应压缩感知编码。基于子带能量的自适应压缩感知能量加权,采用子带能量统计的方式对音频信号进行自适应压缩感知能量加权;自适应压缩感知稀疏分解,采用基于音频信号特征的稀疏变换矩阵和观测矩阵,本发明解决了实际音频通信系统中的低复杂度、低存储量的音频编码问题。
-
公开(公告)号:CN113905323B
公开(公告)日:2024-01-23
申请号:CN202111261650.8
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种适用于服务型机器人播放音频时的感知声源高度修正方法,包括以下步骤:服务型机器人本地设备存储了各种头相关传递函数HRTF构成头相关传递函数HRTF数据库,各种头相关传递函数HRTF涵盖了不同的高度听觉高度信息,服务型机器人根据多模传感交互方式获取人机交互主体听者的高度信息,根据生理高度特征对头相关传递函数HRTF进行匹配,然后对匹配的头相关传递函数HRTF进行微调,卷积本地音频数据,并输出给服务型机器人放音设备。本发明能够有效地实时修正服务型机器人的人机交互声音高度问题,解决了不同的服务型机器人和不同的听者在使用服务型机器人进行人机交互式时的虚拟声像的差异化问题。
-
公开(公告)号:CN112269158A
公开(公告)日:2021-01-26
申请号:CN202011096574.5
申请日:2020-10-14
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于UNET结构利用传声器阵列语音源定位方法,步骤如下:(1)生成训练样本,得到时‑频域信号,并获得功率包络;(2)对时‑频域信号的每个时‑频点,计算对应的语音能量占比和直达路径语音能量占比;(3)利用步骤(1)生成的样本训练多任务UNET结构的神经网络;(4)利用已训练的多任务UNET结构的神经网络预测待测含噪信号每个时‑频点语音直达声能量占比;(5)对判断语音直达声能量占比较高的时‑频点,应用定位方法,得到定位结果。本发明的语音声源定位方法,能够使得在高混响及高干扰的环境中,有效去除干扰和混响的影响,获得精确度和鲁棒性较高的结果。
-
公开(公告)号:CN109658950B
公开(公告)日:2022-11-11
申请号:CN201811342150.5
申请日:2018-11-13
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司 , 马鞍山艾德声电子技术有限公司
IPC: G10L21/0232
Abstract: 本发明公开了一种混合频域自适应算法,通过分析NFBLMS和MFBLMS算法的误差收敛轨迹图,得到在NFBLMS和MFBLMS算法之间的最佳切换参数为误差能量;在收敛初期或声环境发生变化时执行NFBLMS算法以便快速收敛;通过分析计算NFBLMS算法在收敛初期的收敛速度,然后对误差总能量J(k)期望值Jm(k)的收敛曲线进行拟合估计;当Jm(k)降低幅度小于预定阈值时,从NFBLMS算法切换到MFBLMS算法,然后收敛到维纳解;当声环境发生变化时,将误差能量与参考信号能量的比值ξ(k)作为从MFBLMS算法向NFBLMS算法切换的参数;本发明运算量小,同时能保证混合算法的普遍适应性。
-
公开(公告)号:CN112269158B
公开(公告)日:2022-09-16
申请号:CN202011096574.5
申请日:2020-10-14
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于UNET结构利用传声器阵列语音源定位方法,步骤如下:(1)生成训练样本,得到时‑频域信号,并获得功率包络;(2)对时‑频域信号的每个时‑频点,计算对应的语音能量占比和直达路径语音能量占比;(3)利用步骤(1)生成的样本训练多任务UNET结构的神经网络;(4)利用已训练的多任务UNET结构的神经网络预测待测含噪信号每个时‑频点语音直达声能量占比;(5)对判断语音直达声能量占比较高的时‑频点,应用定位方法,得到定位结果。本发明的语音声源定位方法,能够使得在高混响及高干扰的环境中,有效去除干扰和混响的影响,获得精确度和鲁棒性较高的结果。
-
公开(公告)号:CN113707136B
公开(公告)日:2021-12-31
申请号:CN202111258776.X
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种服务型机器人语音交互的音视频混合语音前端处理方法,具体步骤如下:(1)通过视频处理手段捕获期望说话人嘴部动作信息;(2)根据期望说话人嘴部动作信息获得准确的语音激活检测结果;(3)根据语音活动检测结果,优化机器人传声器阵列的波束算法;(4)通过阵列传声器实现语音增强,抑制环境噪声,提升机器人采集语音的信噪比。本发明在机器人所处复杂声场环境中可以有效提升机器人采集语音的信号质量。
-
公开(公告)号:CN110718205B
公开(公告)日:2023-02-14
申请号:CN201910985890.9
申请日:2019-10-17
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
IPC: G10K11/178
Abstract: 本发明公开了一种无次级路径有源噪声控制系统及实现方法,包括一个以上的子带自适应滤波器、子带分解器一、子带分解器二、子带综合器、全通带控制滤波器,所述子带自适应滤波器包括依次连接的相位调节器和子带控制滤波器,本发明使用相位调节器替代传统有源噪声控制系统中的次级路径滤波,该系统通过计算来获得相位调节器的调节值,进而使系统达到最优的收敛和控制效果。
-
公开(公告)号:CN113990335A
公开(公告)日:2022-01-28
申请号:CN202111260920.3
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10L19/16
Abstract: 本发明公开了一种基于压缩感知的音频编解码方法,本发明音频编码中的待量化信号类型是压缩感知的稀疏分解后的降维信号,解码输出端需要进行稀疏分解的音频信号重构操作,编解码过程中采用区间能量方式进行自适应压缩感知编码。基于子带能量的自适应压缩感知能量加权,采用子带能量统计的方式对音频信号进行自适应压缩感知能量加权;自适应压缩感知稀疏分解,采用基于音频信号特征的稀疏变换矩阵和观测矩阵,本发明解决了实际音频通信系统中的低复杂度、低存储量的音频编码问题。
-
公开(公告)号:CN110718205A
公开(公告)日:2020-01-21
申请号:CN201910985890.9
申请日:2019-10-17
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
IPC: G10K11/178
Abstract: 本发明公开了一种无次级路径有源噪声控制系统及实现方法,包括一个以上的子带自适应滤波器、子带分解器一、子带分解器二、子带综合器、全通带控制滤波器,所述子带自适应滤波器包括依次连接的相位调节器和子带控制滤波器,本发明使用相位调节器替代传统有源噪声控制系统中的次级路径滤波,该系统通过计算来获得相位调节器的调节值,进而使系统达到最优的收敛和控制效果。
-
公开(公告)号:CN109658950A
公开(公告)日:2019-04-19
申请号:CN201811342150.5
申请日:2018-11-13
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司 , 马鞍山艾德声电子技术有限公司
IPC: G10L21/0232
Abstract: 本发明公开了一种混合频域自适应算法,通过分析NFBLMS和MFBLMS算法的误差收敛轨迹图,得到在NFBLMS和MFBLMS算法之间的最佳切换参数为误差能量;在收敛初期或声环境发生变化时执行NFBLMS算法以便快速收敛;通过分析计算NFBLMS算法在收敛初期的收敛速度,然后对误差总能量J(k)期望值Jm(k)的收敛曲线进行拟合估计;当Jm(k)降低幅度小于预定阈值时,从NFBLMS算法切换到MFBLMS算法,然后收敛到维纳解;当声环境发生变化时,将误差能量与参考信号能量的比值ξ(k)作为从MFBLMS算法向NFBLMS算法切换的参数;本发明运算量小,同时能保证混合算法的普遍适应性。
-
-
-
-
-
-
-
-
-