一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法

    公开(公告)号:CN107845389A

    公开(公告)日:2018-03-27

    申请号:CN201711397819.6

    申请日:2017-12-21

    Abstract: 本发明提出了一种基于多分辨率倒谱系数和卷积神经网络的语音增强方法,首先构建了新的能够区分语音和噪声的特征参数—多分辨率听觉倒谱系数(MR-GFCC);其次,跟踪噪声变化构建了基于理想软掩蔽(IRM)和理想二值掩蔽(IBM)的自适应掩蔽阈值;然后将提取的新特征参数及其一二阶导数和自适应掩蔽阈值作为深度卷积神经网络(DCNN)的输入和输出,对构建的7层神经网络进行训练;最后利用DCNN估计的自适应掩蔽阈值对含噪语音进行增强。本发明充分利用了人耳的工作机理,提出了模拟人耳听觉生理模型的语音特征参数,不仅可以保留更多的语音信息,而且提取过程简单可行。

    基于双平行马赫-曾德尔调制器的偏压控制方法

    公开(公告)号:CN110677196A

    公开(公告)日:2020-01-10

    申请号:CN201910899181.9

    申请日:2019-09-23

    Abstract: 基于双平行马赫-曾德尔调制器的偏压控制方法涉及微波光子学、光纤传感或光通信领域。本发明通过在DPMZM三个偏置电压控制端上施加固定频率的低频扰动电压,将调制器输出信号选择一定比例反馈进入偏压控制模块,经过光电转换、滤波、放大、采样等硬件电路处理后,再经过MCU中偏置点控制算法计算获得DPMZM所对应支路偏置点电压。将偏置点电压和三个基波与二次谐波不产生重叠的不同频率扰动信号叠加输入到DPMZM偏置电压控制端口。由于三个控制端口使用不同频率的扰动电压,因此将各控制端口的反馈信息在频域分离,实现三个控制端口的独立闭环控制,同时调节DPMZM三个偏置点电压,实现DPMZM对于任意偏置点的稳定控制。

    双耳助听器中基于双耳声源定位和深度学习的语音增强方法

    公开(公告)号:CN109410976A

    公开(公告)日:2019-03-01

    申请号:CN201811292475.7

    申请日:2018-11-01

    Abstract: 双耳数字助听器中基于双耳声源定位和深度学习的语音增强方法,属于语音信号处理领域。首先使用两级的深度神经网络对目标语音给予精确的定位,j结合空间滤波去除与目标语音方向不同的噪声。使用搭建的延时控制双向长短时记忆深度神经网络与分类器相结合的深度学习模型,以提取的多分辨率听觉倒谱系数为特征输入,经过深度学习的非线性处理能力,将每个含噪语音的时频单元分类为语音时频单元或噪声的时频单元,最后利用语音波形合成算法去除与目标语音相同方向的噪声。该算法不仅去除与目标语音不同方向上的噪声也去除与目标语音方向相同的噪声,最终获得满足耳障者的言可懂度和舒适度的增强语音。所有的深度学习模型都采用线下训练,满足实时性。

    一种数字助听器中基于深度学习的双耳声源定位方法

    公开(公告)号:CN108122559A

    公开(公告)日:2018-06-05

    申请号:CN201711397816.2

    申请日:2017-12-21

    Abstract: 本发明公开一种数字助听器中基于深度学习的双耳声源定位方法,首先将双耳声源信号通过gammatone滤波器分解成若干信道,通过加权系数提取高能量的信道,接着利用头相关函数(head-related-transform function,HRTF)提取第一类特征,即耳间时间差(Interaural Time Difference,ITD)和耳间强度差(Interaural Intensity Difference,IID)作为深度学习的输入,将水平面划分为四个象限,缩小定位范围。然后提取头相关传递的第二类特征,即耳间声压差(Interaural Level Difference,ILD)和耳间相位差(Interaural Phase Difference,IPD),最后为了得到更精确的定位,将第一类和第二类的四个特征作为下一个深度学习的输入,从而得到声源定位的方位角。实现在水平面上0度到360度以5度为步长进行72个方位角的精确定位。

    数字助听器中深度和广度神经网络相结合的语音增强算法

    公开(公告)号:CN105611477A

    公开(公告)日:2016-05-25

    申请号:CN201510999943.4

    申请日:2015-12-27

    Inventor: 李如玮 时勇强

    CPC classification number: H04R25/507 H04R2225/43

    Abstract: 数字助听器中深度和广度神经网络相结合的语音增强算法,属于语音信号处理技术领域。该方法首先对含噪语音信号进行语音活动性检测,提取含噪语音信号的自相关函数最大值和频带方差等特征,再利用BP神经网络建立一个二值判决器,判断出语音段和噪声段。其次,提取MFCC和一阶MFCC特征,采用学习向量量化神经网络与BP神经网络级联构成的深度神经网络,检测出噪声的类型。最后,建立多种网络并联构成的广度神经网络,根据噪声的类型,广度神经网络自动选取相应的神经网络,去除噪声,得到增强后的语音,提高助听器输出语音的可懂度。该算法中神经网络的训练过程都是在线下完成,而训练好的网络的测试算法复杂度低,因此,满足实时性。

    基于CS和简化FrFT的UWB-LFM信号参数估计方法

    公开(公告)号:CN112731306B

    公开(公告)日:2024-03-15

    申请号:CN202011509981.4

    申请日:2020-12-19

    Abstract: 本发明公开了基于CS和简化FrFT的UWB‑LFM信号参数估计方法,本方法将压缩感知方法引入,首先对超宽带线性调频信号进行稀疏表示、AIC采样;其次建立了离散的简化分数阶傅里叶变换字典作为基字典矩阵进行观测并降低算法复杂度;最后使用改进的CoSaMP重构算法对观测向量进行重构,将传统ROMP重构算法中的正则化与SAMP重构算法中的自适应思想进行结合,改善了实际应用中缺乏先验信号信息和计算量庞大的缺陷,以提升信号的重建精度和抗干扰能力,具有良好的精准性与实时性。

    一种基于网络安全探针的流量快速精确检测方法

    公开(公告)号:CN113904795A

    公开(公告)日:2022-01-07

    申请号:CN202110992646.2

    申请日:2021-08-27

    Abstract: 本发明公开了一种基于网络安全探针的流量快速精确检测方法,基于流量特征的设备资产识别接入控制技术及基于设备的智能安全管理模型。通过基于流量特征提取的设备资产识别方法,通过设置白名单,构建流量特征指纹库并通过在现有流识别算法基础上创新性的引入改进的随机森林算法与K‑Means聚类算法相结合的而提出的新的K‑Random聚类算法来训练设备识别模型以及通过主被动的扫描,从而达到更全面的获取设备分类以及相关的流量,从而实现了对设备的分类,对非白名单设备的接入控制;通过在现有的流量监测算法基础上创新性的设计一种基于sketch算法与哈希算法相结合从而设计出最优的未知流量监测算法CMⅡ‑Sketch算法,从而实现对流量的精准识别。

    基于CS和简化FrFT的UWB-LFM信号参数估计方法

    公开(公告)号:CN112731306A

    公开(公告)日:2021-04-30

    申请号:CN202011509981.4

    申请日:2020-12-19

    Abstract: 本发明公开了基于CS和简化FrFT的UWB‑LFM信号参数估计方法,本方法将压缩感知方法引入,首先对超宽带线性调频信号进行稀疏表示、AIC采样;其次建立了离散的简化分数阶傅里叶变换字典作为基字典矩阵进行观测并降低算法复杂度;最后使用改进的CoSaMP重构算法对观测向量进行重构,将传统ROMP重构算法中的正则化与SAMP重构算法中的自适应思想进行结合,改善了实际应用中缺乏先验信号信息和计算量庞大的缺陷,以提升信号的重建精度和抗干扰能力,具有良好的精准性与实时性。

    一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法

    公开(公告)号:CN107845389B

    公开(公告)日:2020-07-17

    申请号:CN201711397819.6

    申请日:2017-12-21

    Abstract: 本发明提出了一种基于多分辨率倒谱系数和卷积神经网络的语音增强方法,首先构建了新的能够区分语音和噪声的特征参数—多分辨率听觉倒谱系数(MR‑GFCC);其次,跟踪噪声变化构建了基于理想软掩蔽(IRM)和理想二值掩蔽(IBM)的自适应掩蔽阈值;然后将提取的新特征参数及其一二阶导数和自适应掩蔽阈值作为深度卷积神经网络(DCNN)的输入和输出,对构建的7层神经网络进行训练;最后利用DCNN估计的自适应掩蔽阈值对含噪语音进行增强。本发明充分利用了人耳的工作机理,提出了模拟人耳听觉生理模型的语音特征参数,不仅可以保留更多的语音信息,而且提取过程简单可行。

Patent Agency Ranking