一种基于相干约束的鲁棒性主动路噪控制方法

    公开(公告)号:CN119673138A

    公开(公告)日:2025-03-21

    申请号:CN202411890924.3

    申请日:2024-12-20

    Abstract: 本发明公开了一种基于相干约束的鲁棒性主动路噪控制方法。其步骤包括:(1)对主动路噪控制系统进行硬件配置;(2)实时计算误差信号和参考信号的多重相干系数,并用其作为控制滤波器更新的步长约束因子;(3)通过次级路径分解和参考信号白化,结合频域滤波误差最小均方算法进行控制滤波器的更新;(4)将控制滤波器转换至时域,实时输出控制信号驱动对消扬声器发声,经由次级路径传播后在误差传声器处与路噪信号相干叠加,在人耳附近产生静区。本发明能够使用在多通道复杂场景下的主动路噪控制系统中,基于相干约束的稳定保护方法,在稳态场景中获得了更快的收敛速度和更低的稳态误差,在含噪场景中提高了系统的鲁棒性。

    一种结合指向性语音活动检测的定向拾音方法

    公开(公告)号:CN118317225A

    公开(公告)日:2024-07-09

    申请号:CN202410316269.4

    申请日:2024-03-20

    Abstract: 本发明公开了一种结合指向性语音活动检测的定向拾音方法。包括以下步骤:生成多人说话场景下的含噪语音信号和标注数据;使用含噪语音信号和DVAD标注作为DVAD模块的输入和目标,训练模块;生成多人说话场景下的含噪语音信号、DVAD标注和目标话者语音,结合标注数据,通过GSC构造FBF和GSC的输出信号;使用FBF和GSC的输出,以及标注数据作为PF模块的输入,目标话者语音作为目标,训练模块;使用训练完成的DVAD模块预测含噪语音,结合DVAD预测和GSC获得FBF和GSC输出,使用训练完成的PF模块对两路输出以及DVAD预测作后处理。本发明能够在背景噪声和竞争话者存在的场景下,有效地抑制干扰信号,同时较完整地保留目标语音成分。

    一种基于深度相机的双耳定位及有源降噪方法

    公开(公告)号:CN117765077A

    公开(公告)日:2024-03-26

    申请号:CN202311791913.5

    申请日:2023-12-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于深度相机的双耳定位及有源降噪方法,首先进行人体彩色图像与深度图像采集,并基于二维人体姿态估计算法确定关键点二维坐标;通过彩色图与深度图对齐,获取关键点对应三维坐标;在一只耳朵被遮挡情况下,使用后处理算法,基于人脸对称性,利用未被遮挡耳朵的三维坐标估计得到被遮挡耳朵的三维坐标;将双耳位置信息传输给有源降噪头枕系统,由其选取距离耳朵最近的预存的空间采样点,调用对应的预先存储的控制滤波器进行降噪。本发明系统双耳定位误差在毫米量级,具有实时性,相较于已有的结合人头追踪的有源降噪头枕系统具有结构简单,实用性强的优点,对于人头在三维空间中平动与转动的情况,均具有很好的降噪表现。

    基于深度学习的文本无关多标号说话人识别方法

    公开(公告)号:CN111667836B

    公开(公告)日:2023-05-05

    申请号:CN202010563201.8

    申请日:2020-06-19

    Applicant: 南京大学

    Inventor: 邓克琦 卢晶

    Abstract: 本发明公开了一种基于深度学习的文本无关多标号说话人识别方法。该方法包括以下步骤:(1)将训练数据集中每个说话人的语音平均分成N份,每份标记上不同的标号;(2)构建相应的神经网络模型,并保证输出层维度与训练数据集标号数一致;(3)将训练数据输入神经网络,并将输出层结果与数据对应的标号相比较,求出交叉熵损失函数,从而进行训练;(4)将测试集数据按照步骤1中训练数据集对应关系为每个说话人的语音数据预设好N个视为有效识别的标号,将测试数据集数据输入神经网络,将模型预测出的标号与预设好的N个标号相比较,只要满足其中之一即为正确识别。本发明的方法能够有效提升模型在纯净以及含噪环境下的说话人识别性能。

    基于声聚焦的参量阵扬声器低频响应增强的方法及装置

    公开(公告)号:CN115460511A

    公开(公告)日:2022-12-09

    申请号:CN202211126901.6

    申请日:2022-09-16

    Applicant: 南京大学

    Abstract: 本发明属于扬声器技术领域,公开了一种基于声聚焦的参量扬声器低频响应增强的方法及装置。该方法包括以下步骤:(1)确定需要低频响应增强的听音位置,设为声聚焦的焦点;(2)计算出超声换能器各阵列各单元声信号聚焦到焦点的时延;(3)对超声换能器各阵列各单元的超声载波进行延时,生成聚焦超声信号;(4)将待播放的音频信号调制到聚焦超声信号上,并经信号放大后驱动超声换能器阵列发声。本发明的方法能够显著增强焦点附近的音频声声压级,在低频时的提升效果更明显。

    一种适用于抑制发动机噪声的主动控制方法

    公开(公告)号:CN115273787A

    公开(公告)日:2022-11-01

    申请号:CN202210854136.3

    申请日:2022-07-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种适用于抑制发动机噪声的主动控制方法,可以有效控制连续快速变化的发动机噪声。该方法包括以下步骤:(1)次级路径建模;(2)将经过滤波的含噪参考信号矢量和含噪期望信号共同构成一个数据扩展矩阵;(3)根据传统的线性回归方法,最小化数据拓展矩阵的均方值,从而得到算法的代价函数;(4)最小化代价函数,并用随机梯度下降的方法求解,得到控制滤波器的递归更新公式,根据迭代公式对控制滤波器系数迭代;(5)更新完成后根据控制滤波器的最后一个系数对整个控制滤波器系数进行归一化操作;(6)不断迭代控制滤波器系数,使得代价函数最小。本发明的方法可以对连续变化的发动机噪声实现良好的跟踪和控制性能。

    基于PESQ驱动的强化学习估计先验信噪比的语音增强方法

    公开(公告)号:CN114141266A

    公开(公告)日:2022-03-04

    申请号:CN202111516319.6

    申请日:2021-12-08

    Applicant: 南京大学

    Inventor: 雷桐 卢晶

    Abstract: 本发明公开了一种基于PESQ驱动的强化学习估计先验信噪比的语音增强方法,具体步骤如下:(1)使用清晰语音和噪声数据集生成模拟含噪语音,并做短时傅里叶变换得到短时傅里叶谱;(2)用清晰语音和含噪语音的短时傅里叶谱训练Deep Xi‑TCN网络;(3)用理想的映射信噪比通过K‑means聚类生成有限个聚类中心,作为先验信噪比模板;(4)正式训练阶段,通过DQN网络在帧层面挑选Deep Xi‑TCN推断的信噪比或者先验信噪比模板,计算出与PESQ值相关的奖励,进行强化学习迭代,更新网络参数;(5)将含噪语音短时傅里叶谱输入完成训练的模型,得到的增强语音的短时傅里叶谱,再进行逆短时傅里叶变换。本发明能进一步优化Deep Xi‑TCN推断的先验信噪比,从而提高与听感相关的语音质量。

    一种针对位置靠近声源的语音信号分离方法

    公开(公告)号:CN113823316A

    公开(公告)日:2021-12-21

    申请号:CN202111125927.4

    申请日:2021-09-26

    Applicant: 南京大学

    Inventor: 廖乐乐 卢晶 陈锴

    Abstract: 本发明公开了一种针对位置靠近声源的语音信号分离方法。该方法的步骤包括:步骤1,获取待处理的混合语音时频域信号;步骤2,初始化各频带的分离矩阵;步骤3,对所有频带的分离矩阵进行联合优化;步骤4,对所述分离矩阵进行幅度规整;步骤5,估计出分离后的时频域语音信号;步骤6,由分离后的时频域语音信号恢复出时域语音信号。本发明的方法可以在声源位置靠近的不利条件下,帮助分离算法获得更好的语音信号分离效果。

    基于卡尔曼滤波的自适应去混响方法

    公开(公告)号:CN110111802B

    公开(公告)日:2021-04-27

    申请号:CN201810102375.7

    申请日:2018-02-01

    Applicant: 南京大学

    Inventor: 向腾 卢晶

    Abstract: 本发明公开了一种基于卡尔曼滤波的自适应去混响方法。该方法包括以下步骤:(1)利用传声器获取信号,然后通过AD转换将模拟信号转换为数字信号;(2)对信号做短时傅里叶变换后,不同频带内的信号单独地利用卡尔曼滤波进行去混响;同时,采用声源定位方法判断声源位置是否改变,若声源位置发生改变,则将卡尔曼滤波的状态预测误差向量协方差矩阵重置为初始值;(3)将步骤2经卡尔曼滤波输出的时‑频域去混响信号通过短时傅里叶变换,得到时域去混响信号。本发明的方法能够有效提升卡尔曼滤波在声源突变场景下的去混响的性能。

    基于RLS算法的自适应去混响方法

    公开(公告)号:CN110111804B

    公开(公告)日:2021-03-19

    申请号:CN201810102374.2

    申请日:2018-02-01

    Applicant: 南京大学

    Inventor: 向腾 卢晶

    Abstract: 本发明公开了一种基于RLS算法的自适应去混响方法。该方法包括以下步骤:步骤1,利用传声器获取信号,然后通过模数转换将模拟信号转换为数字信号;步骤2,对信号做短时傅里叶变换后,不同频带内的信号单独地利用RLS算法进行去混响;步骤3,对滤波器输出的时‑频域的去混响信号做短时傅里叶逆变换,得到时域的去混响信号。本发明根据滤波器系数的变化量对声源位置进行检测,设计时变的遗忘因子,使得RLS算法在去混响时的声源突变情况下,既具有较快的收敛速度又能有较好的稳态去混响性能。

Patent Agency Ranking