一种基于子带信噪比估计的低复杂度双端检测方法

    公开(公告)号:CN112185404B

    公开(公告)日:2023-09-19

    申请号:CN201910601964.4

    申请日:2019-07-05

    Abstract: 本发明公开了一种基于子带信噪比估计的低复杂度双端检测方法,包括以下步骤。首先将一帧信号通过分解滤波器得到子带信号,并进行降采样处理;其次在每个子带信号的每帧内找最大值,再将其转到对数域,得到阶梯包络;然后分别估计语音包络和噪声包络,得到当前帧的信噪比估计值;最后将子带信噪比映射为双端判决阈值,将自适应判决阈值应用到相关性判决因子上。使系统进入双讲状态时,及时冻结自适应滤波器的更新步长。本发明在复杂的噪声环境下,能有效提高回声抵消器的双端检测的准确率,在音频会议系统中具有良好的应用前景。

    基于深度学习网络的麦克风信号回声消除模型构建方法

    公开(公告)号:CN114283830A

    公开(公告)日:2022-04-05

    申请号:CN202111554165.X

    申请日:2021-12-17

    Abstract: 本发明公开了基于深度学习网络的麦克风信号回声消除模型构建方法。本发明采用归一化最小均方算法消除由多路径和房间声学冲激响应引入的线性回声,然后利用残余回声信号和近端麦克风信号计算IRM作为训练目标,并将经过归一化最小均方算法处理的近端麦克风信号和远端参考信号作为输入,构建具有实时编码器‑解码器结构的CRN模型;最后,将预估残余信号从近端麦克风信号中减去重构语音,本发明联合归一化最小均方算法与基于CRN模型的深度学习网络实时回声消除算法,可以提高麦克风回声消除的性能,具有良好的应用前景。

    面向免验配助听器的语音质量自评估方法

    公开(公告)号:CN111968677B

    公开(公告)日:2021-09-07

    申请号:CN202010854269.1

    申请日:2020-08-21

    Abstract: 本发明公开了一种面向免验配助听器的语音质量自评估方法,包括:构建并训练语音质量自评估网络:待测语音通过卷积神经网络提取并输出待测语音的帧级特征;待测语音的帧级特征通过循环神经网络得到并输出待测语音的段级特征;待测语音的段级特征输入至线性映射模型和Softmax分类器,对分类器的输出进行判决确定语音的失真类型,并结合线性映射模型的输出得到客观评分。本发明公开了一种面向免验配助听器的语音质量自评估方法,将卷积神经网络、循环神经网络和Softmax分类器有机地结合成一个整体,结合卷积神经网络的特征挖掘能力和循环神经网络的时序建模能力,提高无参考语音质量客观评价方法准确度,大大简化了处理过程。

    一种面向瞬态噪声抑制的实时语音增强方法

    公开(公告)号:CN110739005A

    公开(公告)日:2020-01-31

    申请号:CN201911035076.7

    申请日:2019-10-28

    Abstract: 本发明公开了一种面向瞬态噪声抑制的实时语音增强方法,包括步骤:采用分位噪声估计法来获得稳态噪声谱;利用基于信号重心的方法检测瞬态噪声,并根据是否存在瞬态噪声来修正稳态噪声谱;结合语音特征和谐波分析来估计语音存在概率;在语音概率估计的基础上,计算信号增益并作用于含噪语音,从而实现语音增强。本发明提出的方法,能够对瞬态噪声进行有效抑制,在综合语音增强性能和实时性指标方面,明显优于其它经典的语音增强方法。

    基于深度学习网络的助听器自验配方法

    公开(公告)号:CN109151692A

    公开(公告)日:2019-01-04

    申请号:CN201810767514.8

    申请日:2018-07-13

    Abstract: 本发明公开了一种基于深度学习网络的助听器自验配方法,通过构建患者综合信息库,通过对患者和验配过程的深入分析,发现验配过程中有效的策略,从而构建新的智能助听器自验配模型,提高验配效率;引入深度学习网络,通过大量的数据训练,使网络具有人工智能,能根据患者的基本信息快速生成符合患者听损特性的语音信息,同时还能根据患者的评价反馈,自动调节输入增益,大大缩短验配时间,改善用户满意度。

    基于卷积双向长短时记忆网络的语音测谎方法

    公开(公告)号:CN108520753A

    公开(公告)日:2018-09-11

    申请号:CN201810159072.9

    申请日:2018-02-26

    Abstract: 本发明公开了一种基于卷积双向长短时记忆网络的语音测谎方法,包括将整段语音进行统一归一化处理;根据数据库标签对统一归一化处理的语音进行切分;对切分的语音加窗分帧处理;建立变长数据的计算方式;将卷积操作引入长短时记忆网络中;构建完整的语音测谎网络模型;训练语音测谎网络模型,并加窗分帧处理后的语音进行测谎评测。本发明通过将卷积操作引入长短时记忆网络中,构建完整的语音测谎网络模型,实现深度学习,从原始语音数据中提取适用于谎言检测的特征,以提高谎言检测的性能,具有良好的应用前景。

    一种助听器自验配方法

    公开(公告)号:CN104053112B

    公开(公告)日:2017-09-12

    申请号:CN201410292892.7

    申请日:2014-06-26

    Abstract: 本发明公开了一种助听器自验配方法,该方法首先建立知识库,找出与当前患者最相似的历史患者,获得该历史患者的最优化助听器算法参数,然后当前患者对声音质量进行满意度评估,根据评价指标迭代更新助听器算法参数,并与知识库进行交互,然后根据更新的助听器算法参数生成测试声音给当前患者,直到当前患者满意为止。本发明引入知识库,极大地缩小了助听器算法参数匹配范围,显著提高了助听器验配效率;根据评价指标迭代更新助听器算法参数,最大限度的满足当前患者对助听器的期望值,提高了助听器算法参数的精确性。

    一种基于卷积神经网络的言语置信度评测方法

    公开(公告)号:CN106901758A

    公开(公告)日:2017-06-30

    申请号:CN201710099098.4

    申请日:2017-02-23

    Abstract: 本发明公开了一种基于卷积神经网络的言语置信度评测方法。该方法首先对采集的语音样本进行分帧,并提取每帧的梅尔倒谱系数,构成单通道梅尔倒谱系数图像;然后构建六层卷积神经网络,构建前三层为使用尺寸不同的卷积滤波器的卷积层,第四层为生成全局特征图的聚合层,第五层和第六层为由2048个线性修正单元的全连层;最后将梅尔倒谱系数图像输入构建的卷积神经网络进行言语置信度评测。实验结果显示,该置信度评测方法对谎言的识别率达到73%。

    一种面向语音情感识别的语谱特征提取方法

    公开(公告)号:CN104637497A

    公开(公告)日:2015-05-20

    申请号:CN201510020519.0

    申请日:2015-01-16

    Abstract: 本发明公开了一种面向语音情感识别的语谱特征提取方法,步骤一,对语音信号分帧,并进行快速傅里叶变换得到对应的语谱图;步骤二,对语谱图进行分解;步骤三,对分解图像进行中央周边差运算并归一化,得到每幅分解图的特征图;步骤四,提取每幅特征图的特征矩阵;步骤五,特征矩阵降维并重构。本发明从分析语音语谱特征的角度,综合运用图像处理的一些方法,从创新的角度挖掘情感识别的特征,采用多尺度多通道的滤波器对语谱图进行分解,在不同的特征域进行处理,并结合PCA分析,更好的挖掘对语音情感有益的信息。

    一种双耳助听器语音增强方法

    公开(公告)号:CN104038880A

    公开(公告)日:2014-09-10

    申请号:CN201410295526.7

    申请日:2014-06-26

    Abstract: 本发明公开了一种双耳助听器语音增强方法,该方法包括以下步骤:拾取双耳声学信号;将双耳声学信号分别进行频带分解,得到子带声学信号;计算双耳子带声学信号的联合特征,估计声源所在位置;分别延迟左耳和右耳的子带声学信号,并与不延迟的右耳和左耳的子带声学信号相减或相加,增强指定方向声音;根据噪声源位置,自适应调节延迟参数,抑制噪声信号,得到增强的语音信号。该方法可实现语音信号的方向性增强,并保留语音的自然度。

Patent Agency Ranking