-
公开(公告)号:CN102081368A
公开(公告)日:2011-06-01
申请号:CN201110039638.2
申请日:2011-02-17
Applicant: 南京大学 , 深圳市冠旭电子有限公司
Inventor: 邹海山 , 陈锴 , 卢晶 , 吴海全 , 陈家兴 , 陶建成 , 林志斌 , 师瑞文 , 董家富 , 邱小军 , 李宁荣 , 吴训 , 耿锡年 , 陈卫松 , 彭久高 , 曾荣源
IPC: G05B19/042
Abstract: 本发明公开了一种可级联的前馈有源控制单元,以及一种由该单元级联组成的分布式有源控制系统。该单元包括参考信号条件模块、误差信号条件模块、数字信号处理模块、滤波模块、控制信号驱动模块、级联通讯模块、串口通讯模块。该单元采用前馈单通道自适应控制算法,控制效果好,控制系统稳定。一个该单元可独立作为单通道前馈有源控制系统使用。该单元的级联通讯模块用于连接其它单元,使得多个该单元可串行级联组成分布式前馈有源控制系统,控制系统的总通道数可以根据需要任意增减,各单元可通过级联通讯模块实现单元间的信息传输。该单元的串口通讯模块用于连接计算机,可通过计算机对由该单元组成的单通道前馈有源控制系统或分布式前馈有源控制系统进行管理。本发明的分布式有源控制系统通过多个前馈有源控制单元级联而成,在控制器通道数量较大的场合,可代替多通道控制器使用,降低控制系统的复杂程度和实现成本,该控制系统操作简单,配置灵活,并具有实时控制的能力。
-
公开(公告)号:CN115273787B
公开(公告)日:2025-05-06
申请号:CN202210854136.3
申请日:2022-07-13
Applicant: 南京大学
IPC: G10K11/178
Abstract: 本发明公开了一种适用于抑制发动机噪声的主动控制方法,可以有效控制连续快速变化的发动机噪声。该方法包括以下步骤:(1)次级路径建模;(2)将经过滤波的含噪参考信号矢量和含噪期望信号共同构成一个数据扩展矩阵;(3)根据传统的线性回归方法,最小化数据拓展矩阵的均方值,从而得到算法的代价函数;(4)最小化代价函数,并用随机梯度下降的方法求解,得到控制滤波器的递归更新公式,根据迭代公式对控制滤波器系数迭代;(5)更新完成后根据控制滤波器的最后一个系数对整个控制滤波器系数进行归一化操作;(6)不断迭代控制滤波器系数,使得代价函数最小。本发明的方法可以对连续变化的发动机噪声实现良好的跟踪和控制性能。
-
公开(公告)号:CN117524181A
公开(公告)日:2024-02-06
申请号:CN202311344177.9
申请日:2023-10-17
Applicant: 南京大学
IPC: G10K11/178
Abstract: 本发明提出了一种对人耳实时定位的有源降噪头枕及其降噪方法,用于人耳处的有源噪声控制。该有源降噪头枕包括红外雷达传感器、有源降噪控制器、参考传感器和次级声源,其中,红外雷达传感器安装在头枕上,用于扫描人头轮廓;参考传感器安装在噪声源附近,用于将噪声信号转化为电信号;次级声源用于产生次级声场;红外雷达传感器、参考传感器和次级声源分别与有源降噪控制器连接,有源降噪控制器根据人耳定位结果选择控制参数来控制次级声源。本发明用较低的成本实现了对人耳的定位,集成度高、不侵犯隐私、结构简单,可以提升有源降噪头枕的降噪量。
-
公开(公告)号:CN111653288B
公开(公告)日:2023-05-09
申请号:CN202010557116.0
申请日:2020-06-18
Applicant: 南京大学
IPC: G10L21/0216 , G10L21/0232
Abstract: 本发明公开了一种基于条件变分自编码器的目标人语音增强方法。该方法包括以下步骤:(1)对目标说话人清晰语音数据做短时傅里叶变换得到幅度谱;(2)使用目标说话人清晰语音幅度谱和身份编码向量来训练条件变分自编码器作为语音模型;(3)对含噪语音信号做短时傅里叶变换得到幅度谱和相位谱;(4)将含噪语音幅度谱和目标说话人身份编码向量输入语音模型,固定语音模型解码器权重,将语音模型和非负矩阵分解模型联合迭代优化得到语音和噪声的幅度谱估计;(5)使用幅度谱估计和含噪语音相位谱组合成复数谱,再通过逆短时傅里叶变换得到增强语音时域信号。本发明的方法能够在多种复杂噪声下对目标人语音进行增强,鲁棒性较高。
-
公开(公告)号:CN114827837B
公开(公告)日:2023-03-24
申请号:CN202210272791.8
申请日:2022-03-19
Applicant: 南京大学
Abstract: 本发明公开了一种重建误差约束下最大化声能量对比度的声场分区控制方法。该方法包括以下步骤:(1)测量空间传递函数;(2)给定目标声场,计算PM算法得到的声场向量;(3)给定容许的重建声场误差;(4)将空间传递函数矩阵和PM算法对应的声场向量进行变换;(5)对变换后的相关参数使用坐标下降算法在重建误差约束的前提下最大化声能量对比度,并得到对应的解向量;(6)将解向量逆变换,得到控制滤波器系数。本发明的方法可以在声场重建误差给定的情况下,最大化声能量对比度。
-
公开(公告)号:CN115273885A
公开(公告)日:2022-11-01
申请号:CN202210685223.0
申请日:2022-06-17
Applicant: 南京大学 , 北京地平线信息技术有限公司
IPC: G10L21/0232 , G10L25/30
Abstract: 本发明公开了一种基于频谱压缩和自注意力神经网络的全频带语音增强方法。其步骤为:使用清晰语音数据集、噪声数据集以及房间冲激响应数据集合成模拟含噪混响语音;对模拟含噪混响语音数据和对应的纯净混响语音数据分别做短时傅里叶变换得到短时傅里叶谱;使用短时傅里叶谱训练SCM‑DPARN模型权重;对待增强的含噪混响语音信号做短时傅里叶变换得到短时傅里叶谱;将待增强的含噪混响语音短时傅里叶谱输入完成训练的SCM‑DPARN模型,得到增强语音的短时傅里叶谱;最后对增强语音的短时傅里叶谱进行逆短时傅里叶变换得到增强语音的时域信号。本发明对频域的全局信息进行建模,使模型具有更好的噪声抑制和语音质量保留能力。
-
公开(公告)号:CN115171712A
公开(公告)日:2022-10-11
申请号:CN202210626652.0
申请日:2022-06-04
Applicant: 南京大学
IPC: G10L21/0208 , G10L21/0224 , G10L21/0232 , G10L21/0264
Abstract: 本发明公开了一种适用于瞬态噪声抑制的语音增强方法,包括如下步骤:(1)对干净语音数据集中的语音数据作短时傅里叶变换得到功率谱;(2)用功率谱训练VAE模型权重;(3)对待增强的含噪信号作短时傅里叶变换得到时频谱和功率谱;(4)对功率谱作NMF,计算分解得到的各模态时域指标和频域指标,估计其中属于瞬态噪声的成分并滤除;(5)将滤除瞬态噪声的功率谱输入到完成训练的VAE模型,结合NMF得到估计的语音功率谱和噪声功率谱;(6)将估计的语音功率谱和噪声功率谱以及含噪信号的时频谱经过维纳滤波,得到增强语音的时频谱。本发明能够在瞬态噪声存在的场景下对语音进行有效的噪声抑制,同时较完整地保留语音成分。
-
公开(公告)号:CN114827837A
公开(公告)日:2022-07-29
申请号:CN202210272791.8
申请日:2022-03-19
Applicant: 南京大学
Abstract: 本发明公开了一种重建误差约束下最大化声能量对比度的声场分区控制方法。该方法包括以下步骤:(1)测量空间传递函数;(2)给定目标声场,计算PM算法得到的声场向量;(3)给定容许的重建声场误差;(4)将空间传递函数矩阵和PM算法对应的声场向量进行变换;(5)对变换后的相关参数使用坐标下降算法在重建误差约束的前提下最大化声能量对比度,并得到对应的解向量;(6)将解向量逆变换,得到控制滤波器系数。本发明的方法可以在声场重建误差给定的情况下,最大化声能量对比度。
-
公开(公告)号:CN110838303B
公开(公告)日:2022-02-08
申请号:CN201911069273.0
申请日:2019-11-05
Applicant: 南京大学
Abstract: 本发明公开了一种利用传声器阵列的语音声源定位方法,步骤如下:(1)生成训练样本,得到时‑频域信号,并获得功率包络;(2)对时‑频域信号的每个时‑频点,判断是否为语音直达声信号;(3)利用步骤(1)生成的样本训练UNET结构的神经网络;(4)利用已训练的UNET结构的神经网络预测待测含噪信号语音直达声对应的时‑频点;(5)对判断为语音直达声的时‑频点,应用定位方法,得到定位结果。本发明的语音声源定位方法,能够使得在高混响及高干扰的环境中,有效去除干扰和混响的影响,获得精确度和鲁棒性较高的结果。
-
公开(公告)号:CN113905323A
公开(公告)日:2022-01-07
申请号:CN202111261650.8
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种适用于服务型机器人播放音频时的感知声源高度修正方法,包括以下步骤:服务型机器人本地设备存储了各种头相关传递函数HRTF构成头相关传递函数HRTF数据库,各种头相关传递函数HRTF涵盖了不同的高度听觉高度信息,服务型机器人根据多模传感交互方式获取人机交互主体听者的高度信息,根据生理高度特征对头相关传递函数HRTF进行匹配,然后对匹配的头相关传递函数HRTF进行微调,卷积本地音频数据,并输出给服务型机器人放音设备。本发明能够有效地实时修正服务型机器人的人机交互声音高度问题,解决了不同的服务型机器人和不同的听者在使用服务型机器人进行人机交互式时的虚拟声像的差异化问题。
-
-
-
-
-
-
-
-
-