一种增益平稳调节的动态范围控制方法及系统

    公开(公告)号:CN111933173B

    公开(公告)日:2022-03-01

    申请号:CN202010767816.2

    申请日:2020-08-03

    Abstract: 本发明公开了一种增益平稳调节的动态范围控制算法及系统,涉及音频信号处理技术领域,根据实际动态范围控制程度的需要,给定增益曲线相关参数,参数包括过渡段的起始点、过渡段的带宽及压缩段的斜率,通过求出过渡段曲线方程的未知参数,进而得出整个增益曲线;根据输入语音信号的幅度大小及增益曲线确定实时增益,通过期望增益和实际增益的平稳调节,确保参与运算的增益平稳变化。本发明的方法通过数据缓存,进一步确保增益能够跟上当前点数据对增益的需要,使得结果准确,与经典DRC算法相较,本发明所用方法的突出优势在于能够较小失真地对原始音频信号进行缩放处理,不会对后续功能模块造成影响。

    一种面向瞬态噪声抑制的实时语音增强方法

    公开(公告)号:CN110739005B

    公开(公告)日:2022-02-01

    申请号:CN201911035076.7

    申请日:2019-10-28

    Abstract: 本发明公开了一种面向瞬态噪声抑制的实时语音增强方法,包括步骤:采用分位噪声估计法来获得稳态噪声谱;利用基于信号重心的方法检测瞬态噪声,并根据是否存在瞬态噪声来修正稳态噪声谱;结合语音特征和谐波分析来估计语音存在概率;在语音概率估计的基础上,计算信号增益并作用于含噪语音,从而实现语音增强。本发明提出的方法,能够对瞬态噪声进行有效抑制,在综合语音增强性能和实时性指标方面,明显优于其它经典的语音增强方法。

    一种通道自适应的数字助听器宽动态范围压缩方法

    公开(公告)号:CN113993053A

    公开(公告)日:2022-01-28

    申请号:CN202111258499.2

    申请日:2021-10-27

    Abstract: 本发明公开一种通道自适应的数字助听器宽动态范围压缩方法,首先,通过模拟人耳听觉特性选择一种非对称滤波器组分解与综合算法,然后根据患者听力图并融合心理声学模型设计滤波器组通道数和参数,得到符合患者听损的个性化滤波器组;最后运用上述方法的数字助听器对输入的声音信号分通道进行宽动态范围压缩;压缩的具体步骤包括:对输入信号进行自适应通道滤波器组分解,得到自适应通道的信号;对分解后的每个通道信号进行响度补偿;对补偿后的各通道信号进行滤波器组综合,得到全带信号;将综合后的全带信号转换为声音信号输出。在满足性能要求的同时降低系统的计算复杂度,提高患者的言语可懂度。

    一种基于子带信噪比估计的低复杂度双端检测方法

    公开(公告)号:CN112185404A

    公开(公告)日:2021-01-05

    申请号:CN201910601964.4

    申请日:2019-07-05

    Abstract: 本发明公开了一种基于子带信噪比估计的低复杂度双端检测方法,包括以下步骤。首先将一帧信号通过分解滤波器得到子带信号,并进行降采样处理;其次在每个子带信号的每帧内找最大值,再将其转到对数域,得到阶梯包络;然后分别估计语音包络和噪声包络,得到当前帧的信噪比估计值;最后将子带信噪比映射为双端判决阈值,将自适应判决阈值应用到相关性判决因子上。使系统进入双讲状态时,及时冻结自适应滤波器的更新步长。本发明在复杂的噪声环境下,能有效提高回声抵消器的双端检测的准确率,在音频会议系统中具有良好的应用前景。

    面向麦克风阵列的通道注意力加权的语音增强方法

    公开(公告)号:CN112151059A

    公开(公告)日:2020-12-29

    申请号:CN202011028613.8

    申请日:2020-09-25

    Abstract: 本发明公开了一种面向麦克风阵列的通道注意力加权的语音增强方法,方法包括:从麦克风阵列中的每个麦克风分别采集一路带噪的语音时域信号;构建多通道语音增强模型;将麦克风阵每路带噪语音的短时傅里叶变换频谱作为多通道语音增强模型的输入特征,对多通道语音增强模型进行预训练;将麦克风阵列采集的多路含噪语音输入到多通道语音增强模型,并用该多通道语音增强模型实现麦克风阵列语音增强。本发明采用U‑NET网络对语音频谱特征进行处理,参数量少,计算复杂度较低,并在此基础上对通道维度采用注意力机制加权操作,对于每一层编码器和解码器都在通道维度进行注意力加权,在深层结构模拟波束形成对特征进行加权,提高语音增强的性能。

    基于卷积双向长短时记忆网络的语音测谎方法

    公开(公告)号:CN108520753B

    公开(公告)日:2020-07-24

    申请号:CN201810159072.9

    申请日:2018-02-26

    Abstract: 本发明公开了一种基于卷积双向长短时记忆网络的语音测谎方法,包括将整段语音进行统一归一化处理;根据数据库标签对统一归一化处理的语音进行切分;对切分的语音加窗分帧处理;建立变长数据的计算方式;将卷积操作引入长短时记忆网络中;构建完整的语音测谎网络模型;训练语音测谎网络模型,并加窗分帧处理后的语音进行测谎评测。本发明通过将卷积操作引入长短时记忆网络中,构建完整的语音测谎网络模型,实现深度学习,从原始语音数据中提取适用于谎言检测的特征,以提高谎言检测的性能,具有良好的应用前景。

    基于网络模型融合的声场景分类方法

    公开(公告)号:CN110600054A

    公开(公告)日:2019-12-20

    申请号:CN201910845467.9

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于网络模型融合的声场景分类方法,并通过声道分离方式和音频切割等方式构造出多种不同的输入特征,提取音频信号的伽马通滤波器倒谱系数、梅尔频谱特征及其一阶和二阶差分作为输入特征,分别训练对应的多种不同的卷积神经网络模型,最后采用支撑向量机堆叠方法实现最终的融合模型。本发明采用声道分离和音频切割等方式提取出识别性强的音频输入特征,构造了单双两种通道的卷积神经网络,最终生成独特的模型融合结构,能够获得更加丰富与立体的信息,有效提高了不同的声场景分类识别率和鲁棒性,具有良好的应用前景。

    一种言语增强助听方法
    48.
    发明公开

    公开(公告)号:CN109147808A

    公开(公告)日:2019-01-04

    申请号:CN201810767532.6

    申请日:2018-07-13

    CPC classification number: G10L21/02 G06N3/0454 G10L21/0208 H04R25/30

    Abstract: 本发明公开了一种言语增强助听方法,包括以下步骤,步骤(A),多通道语音分解;步骤(B),子带增益调整;步骤(C),言语增强助听网络构建;步骤(D),语音补偿输出:将步骤(B)中进行增益调整后的子带信号输入步骤(C)模型训练后的深度学习网络中,生出补偿后的语音信号,并进行输出。本发明的言语增强助听方法,可以改善传统方法无法抑制与语音同分布噪声的问题,还解决现有技术中言语增强助听方法言语补偿的鲁棒性差、言语补偿效率低下,难以满足患者需求的技术问题,具有良好的应用前景。

    一种面向免验配助听器的参数自调节方法

    公开(公告)号:CN113411733B

    公开(公告)日:2023-04-07

    申请号:CN202110679746.X

    申请日:2021-06-18

    Abstract: 本发明公开了一种面向免验配助听器的参数自调节方法,包括以下步骤:步骤一:确定10组参数[a1,b1,a2,b2,r,s,t]1~10;步骤二:根据患者在中心频率CF处的听力损失,分别计算10组参数对应的内/外毛细胞听力损失,正常耳和患耳的最大增益和补偿系数;步骤三:将输入语音xin分帧加窗,并计算每帧信号的能量谱E(k);步骤四:计算10组参数对应的补偿增益;步骤五:将步骤四计算得出的补偿增益作用在信号谱上,获得补偿后的10组语音信号;步骤六:计算10组语音信号的适应度,并重新生成10组参数。该面向免验配助听器的参数自调节方法根据耳蜗听损模型建立响度补偿模型,同时基于智能算法自适应调节参数,具有响度补偿效果好且调配方便的优点。

Patent Agency Ranking