-
公开(公告)号:CN102184730B
公开(公告)日:2012-08-15
申请号:CN201110039613.2
申请日:2011-02-17
Applicant: 南京大学 , 深圳市冠旭电子有限公司
Inventor: 邹海山 , 卢晶 , 陈锴 , 吴海全 , 陈家兴 , 陶建成 , 林志斌 , 师瑞文 , 董家富 , 邱小军 , 李宁荣 , 吴训 , 耿锡年 , 陈卫松 , 彭久高 , 曾荣源
IPC: G10K11/178 , G10K11/16
Abstract: 本发明公开了一种前馈式有源声屏障。它包括无源声屏障和单通道前馈有源控制系统阵列,组成阵列的每一单通道前馈有源控制系统包括一个参考传声器、一个误差传声器、一个次级声源和一个单通道控制器。次级声源安装在无源声屏障的顶部,参考传声器位于噪声源一侧且靠近屏障顶部,误差传声器位于观测点一侧且靠近屏障顶部。每一单通道前馈有源控制系统的控制器用于控制其对应的次级声源的输出,以使其对应的误差传声器处的声压幅值平方最小。每一单通道前馈有源控制系统的控制器采用前馈单通道自适应控制算法。各单通道控制系统紧凑,成本低,易实现,避免使用多通道控制系统实现难度大且成本高的问题。使用前馈控制系统与现有的反馈式有源声屏障相比,系统稳定性好,控制效果好,且不存在水床效应。
-
公开(公告)号:CN101881119B
公开(公告)日:2012-05-30
申请号:CN201010197540.5
申请日:2010-06-11
Applicant: 南京大学 , 深圳市冠旭电子有限公司
Abstract: 本发明公开了一种在自然通风的同时能有效衰减噪声尤其是低频宽带噪声传入的有源降噪推拉窗:窗体为内外两层水平推拉窗,有源控制系统包括控制器、参考传声器序列、控制源序列和误差传声器序列;其中控制器采用前馈自适应控制并安装在设备盒中,控制源序列安装在窗体上的设备盒和控制源托架中,参考传声器和误差传声器分别安装在内外侧窗的竖直窗框内。本发明预设三种工作状态:完全关窗的密闭隔声状态(有源控制系统不工作);内外侧窗均开启但开启面积均小于全开的50%时的通风有源降噪状态(有源控制系统工作);其他开窗方式下的自由通风状态(有源控制系统不工作)。本发明能在200~600Hz频段获得6dB以上的新增噪声衰减量。
-
公开(公告)号:CN119673188A
公开(公告)日:2025-03-21
申请号:CN202411891387.4
申请日:2024-12-20
Applicant: 南京大学 , 北京地平线信息技术有限公司
IPC: G10L21/02 , G10L25/30 , G10L25/03 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于自适应卷积的超轻量级语音增强神经网络系统及方法。其系统包括编码器:频谱压缩模块,用于对含噪语音频谱进行动态范围和频率维度的压缩;自适应卷积注意力模块,用于通过自适应卷积层和时间通道注意力对压缩后的特征图做频率维度的降采样和特征的提取分析,然后将特征图送入增强器;增强器:双路径分组循环神经网络,用于对语音的子带时间特征和帧内频率特征进行建模;解码器:自适应转置卷积注意力模块,用于对增强器输出的特征图做频率维度的升采样和特征重建;频谱扩张模块,用于对自适应转置卷积注意力模块输出的特征图的频率维度进行扩张。本发明可以以极低的计算复杂度实现较高性能的语音增强。
-
公开(公告)号:CN118230747A
公开(公告)日:2024-06-21
申请号:CN202410198267.X
申请日:2024-02-22
Applicant: 南京大学 , 北京地平线信息技术有限公司
Abstract: 本发明公开了一种适用于语音增强的轻量级神经网络系统及其方法。其系统包括编码器、增强器和解码器,编码器包括:频谱压缩模块,用于对含噪语音频谱在频率维度进行压缩;卷积模块,用于对频谱压缩模块压缩后的特征图做特征提取和频率维度的降采样;分组膨胀卷积模块,用于对卷积模块输出的特征图做进一步特征提取和频率维度的降采样,然后将特征图送入增强器;解码器包括:分组膨胀反卷积模块,用于对经增强器增强后的特征图做特征重建和频率维度的升采样;反卷积模块,用于对特征图做进一步的特征重建和频率维度的升采样;频谱扩张模块,用于对特征图的频率维度进行扩张。本发明可以以较低的参数量和计算量开销实现较高性能的语音增强。
-
公开(公告)号:CN110457796B
公开(公告)日:2023-04-18
申请号:CN201910687255.2
申请日:2019-07-29
Applicant: 南京大学
IPC: G06F30/27 , G06F30/18 , G06N3/126 , G06F111/04 , G06F119/10
Abstract: 本发明公开了一种无规平面差分传声器阵列阵元位置的优化方法。该方法具体步骤如下:(1)采用短时傅里叶变换域上的零点约束方法设计某一频带内的差分波束;(2)根据阵列波束频率不变和白噪声增益性能设计代价函数,计算某一给定传声器位置分布的代价函数值;(3)用遗传算法实现传声器位置分布的优化,求得代价函数取最小值时对应的位置分布,即为传声器的优化位置分布。本发明的方法能够通过传声器位置优化提升差分传声器阵列的性能,与规则的阵列相比能够实现更好的频率不变波束和白噪声增益。
-
公开(公告)号:CN115691462A
公开(公告)日:2023-02-03
申请号:CN202211330868.9
申请日:2022-10-28
Applicant: 南京大学
IPC: G10K11/178
Abstract: 本发明公开了一种基于块扩散滤波最小均方算法的分布式有源噪声控制方法。该方法包括以下步骤:(1)搭建多个相同的分布式节点系统并分配节点编号;(2)依据多通道有源噪声控制系统的搭建环境安排各节点的通信链路,建立通信链路的两个节点称为邻域节点;(3)多通道有源噪声控制系统次级路径辨识;(4)基于邻域的自适应估计阶段;(5)通信阶段:将联合自适应估计分块向量通过通信链路交互地分发给邻域节点;(6)基于节点的融合估计阶段;(7)抽值阶段;(8)优化调整自适应步长。本发明的方法能够应用于多通道有源噪声控制系统中,相较于目前的多通道有源噪声控制系统具有低计算复杂度、高稳定性和高降噪性能的优势。
-
公开(公告)号:CN108806709B
公开(公告)日:2022-07-12
申请号:CN201810607641.1
申请日:2018-06-13
Applicant: 南京大学
IPC: G10L21/0208
Abstract: 本发明公开了一种基于频域卡尔曼滤波的自适应声回声抵消方法。具体步骤如下:(1)采集并缓存近端传声器信号和参考信号,然后通过模数转换将模拟信号转换为数字信号;(2)对数字信号做离散傅里叶变换后,计算出估计的回声信号;(3)根据频域卡尔曼滤波器的迭代公式进行迭代,并按改进公式计算下一帧的滤波器系数;(4)对频域中的回声信号估计做离散傅里叶逆变换,得到时域的回声信号估计,在近端传声器信号中减去时域的回声信号估计,得到经过声回声抵消处理后的信号。本发明的方法在自适应滤波器阶数不足或者系统不满足因果性的条件下也能收敛到最优解,具有较好的回声消除效果。
-
公开(公告)号:CN113990335A
公开(公告)日:2022-01-28
申请号:CN202111260920.3
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10L19/16
Abstract: 本发明公开了一种基于压缩感知的音频编解码方法,本发明音频编码中的待量化信号类型是压缩感知的稀疏分解后的降维信号,解码输出端需要进行稀疏分解的音频信号重构操作,编解码过程中采用区间能量方式进行自适应压缩感知编码。基于子带能量的自适应压缩感知能量加权,采用子带能量统计的方式对音频信号进行自适应压缩感知能量加权;自适应压缩感知稀疏分解,采用基于音频信号特征的稀疏变换矩阵和观测矩阵,本发明解决了实际音频通信系统中的低复杂度、低存储量的音频编码问题。
-
公开(公告)号:CN112037809A
公开(公告)日:2020-12-04
申请号:CN202010940284.8
申请日:2020-09-09
Applicant: 南京大学
IPC: G10L21/0208 , G10L21/0216 , G10L25/18 , G10L25/27 , G10L25/30 , G10L15/06
Abstract: 本发明公开了一种基于多特征流结构深度神经网络的残留回声抑制方法。该方法具体步骤为:(1)通过自适应滤波算法构造带有残留回声和背景噪声的带噪近端语音以及自适应滤波器输出信号;使用自适应滤波器输出信号或远端信号或以上两种信号,作为具有多特征流结构的神经网络模型的参考信号;(2)使用带噪语音信号和参考信号作为神经网络模型的输入特征;使用纯净的近端语音作为模型的训练目标,训练模型;(3)将训练完成的具有多特征流结构的神经网络模型作为后处理滤波器,对自适应滤波器处理后的信号中的残留回声和背景噪声进行抑制,增强近端说话人的音频信号。本发明能够在高残留回声的场景下,有效去除残留回声对近端语音的影响。
-
公开(公告)号:CN111667836A
公开(公告)日:2020-09-15
申请号:CN202010563201.8
申请日:2020-06-19
Applicant: 南京大学
Abstract: 本发明公开了一种基于深度学习的文本无关多标号说话人识别方法。该方法包括以下步骤:(1)将训练数据集中每个说话人的语音平均分成N份,每份标记上不同的标号;(2)构建相应的神经网络模型,并保证输出层维度与训练数据集标号数一致;(3)将训练数据输入神经网络,并将输出层结果与数据对应的标号相比较,求出交叉熵损失函数,从而进行训练;(4)将测试集数据按照步骤1中训练数据集对应关系为每个说话人的语音数据预设好N个视为有效识别的标号,将测试数据集数据输入神经网络,将模型预测出的标号与预设好的N个标号相比较,只要满足其中之一即为正确识别。本发明的方法能够有效提升模型在纯净以及含噪环境下的说话人识别性能。
-
-
-
-
-
-
-
-
-