基于网络模型融合的声场景分类方法

    公开(公告)号:CN110600054B

    公开(公告)日:2021-09-21

    申请号:CN201910845467.9

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于网络模型融合的声场景分类方法,并通过声道分离方式和音频切割等方式构造出多种不同的输入特征,提取音频信号的伽马通滤波器倒谱系数、梅尔频谱特征及其一阶和二阶差分作为输入特征,分别训练对应的多种不同的卷积神经网络模型,最后采用支撑向量机堆叠方法实现最终的融合模型。本发明采用声道分离和音频切割等方式提取出识别性强的音频输入特征,构造了单双两种通道的卷积神经网络,最终生成独特的模型融合结构,能够获得更加丰富与立体的信息,有效提高了不同的声场景分类识别率和鲁棒性,具有良好的应用前景。

    基于改进神经网络的音频篡改识别算法

    公开(公告)号:CN110853656A

    公开(公告)日:2020-02-28

    申请号:CN201910845468.3

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于改进神经网络的音频篡改识别算法,其将任意大小的谱图池化成固定长度的谱图表示的CNNs结构和具有注意力机制的LSTM结构,将信号的梅尔谱图和帧级特征引入到语音篡改识别算法中,综合了音频信号的频谱和时序信息;通过在CNNs结构中加入改进池化层,使得CNNs可以输入任意尺寸谱图,解决音频长度不固定问题;增加注意力机制挖掘高层特征的权重比例,最终得到优质的音频特征;并利用数据融合理论进行决策融合的算法;提高音频篡改识别的识别率和模型的鲁棒性。本发明能够有效识别出音频篡改与否,克服了传统音频篡改识别率较低的问题。

    一种改进的录音设备识别算法

    公开(公告)号:CN110728991B

    公开(公告)日:2022-03-01

    申请号:CN201910841092.9

    申请日:2019-09-06

    Abstract: 本发明公开了一种改进的录音设备识别算法,构建模型一和模型二,模型一包括双向门循环神经网络层、单向门循环神经网络层和注意力层,模型二包括卷积层、跳跃连接层和全局平均池化层,对待检测的音频信号进行分帧和预处理,提取音频信号的多维帧级特征作为模型一的输入、梅尔频谱特征作为模型二的输入,并将模型一和模型二的输出特征进行拼接融合,分类并得出识别结果。本发明的识别算法保留了音频信号的时序特性,通过增加注意力机制、跳跃连接结构和隐藏单元拼接方法等方式,最终得到优质的录音设备相关的特征参数,提高了录音设备的识别效果和模型的鲁棒性。

    基于深度学习网络的助听器自验配方法

    公开(公告)号:CN109151692B

    公开(公告)日:2020-09-01

    申请号:CN201810767514.8

    申请日:2018-07-13

    Abstract: 本发明公开了一种基于深度学习网络的助听器自验配方法,通过构建患者综合信息库,通过对患者和验配过程的深入分析,发现验配过程中有效的策略,从而构建新的智能助听器自验配模型,提高验配效率;引入深度学习网络,通过大量的数据训练,使网络具有人工智能,能根据患者的基本信息快速生成符合患者听损特性的语音信息,同时还能根据患者的评价反馈,自动调节输入增益,大大缩短验配时间,改善用户满意度。

    一种言语增强助听方法
    5.
    发明授权

    公开(公告)号:CN109147808B

    公开(公告)日:2022-10-21

    申请号:CN201810767532.6

    申请日:2018-07-13

    Abstract: 本发明公开了一种言语增强助听方法,包括以下步骤,步骤(A),多通道语音分解;步骤(B),子带增益调整;步骤(C),言语增强助听网络构建;步骤(D),语音补偿输出:将步骤(B)中进行增益调整后的子带信号输入步骤(C)模型训练后的深度学习网络中,生出补偿后的语音信号,并进行输出。本发明的言语增强助听方法,可以改善传统方法无法抑制与语音同分布噪声的问题,还解决现有技术中言语增强助听方法言语补偿的鲁棒性差、言语补偿效率低下,难以满足患者需求的技术问题,具有良好的应用前景。

    基于改进神经网络的音频篡改识别方法

    公开(公告)号:CN110853656B

    公开(公告)日:2022-02-01

    申请号:CN201910845468.3

    申请日:2019-09-06

    Abstract: 本发明公开了一种基于改进神经网络的音频篡改识别算法,其将任意大小的谱图池化成固定长度的谱图表示的CNNs结构和具有注意力机制的LSTM结构,将信号的梅尔谱图和帧级特征引入到语音篡改识别算法中,综合了音频信号的频谱和时序信息;通过在CNNs结构中加入改进池化层,使得CNNs可以输入任意尺寸谱图,解决音频长度不固定问题;增加注意力机制挖掘高层特征的权重比例,最终得到优质的音频特征;并利用数据融合理论进行决策融合的算法;提高音频篡改识别的识别率和模型的鲁棒性。本发明能够有效识别出音频篡改与否,克服了传统音频篡改识别率较低的问题。

    一种改进的录音设备识别算法

    公开(公告)号:CN110728991A

    公开(公告)日:2020-01-24

    申请号:CN201910841092.9

    申请日:2019-09-06

    Abstract: 本发明公开了一种改进的录音设备识别算法,构建模型一和模型二,模型一包括双向门循环神经网络层、单向门循环神经网络层和注意力层,模型二包括卷积层、跳跃连接层和全局平均池化层,对待检测的音频信号进行分帧和预处理,提取音频信号的多维帧级特征作为模型一的输入、梅尔频谱特征作为模型二的输入,并将模型一和模型二的输出特征进行拼接融合,分类并得出识别结果。本发明的识别算法保留了音频信号的时序特性,通过增加注意力机制、跳跃连接结构和隐藏单元拼接方法等方式,最终得到优质的录音设备相关的特征参数,提高了录音设备的识别效果和模型的鲁棒性。

    一种面向瞬态噪声抑制的实时语音增强方法

    公开(公告)号:CN110739005B

    公开(公告)日:2022-02-01

    申请号:CN201911035076.7

    申请日:2019-10-28

    Abstract: 本发明公开了一种面向瞬态噪声抑制的实时语音增强方法,包括步骤:采用分位噪声估计法来获得稳态噪声谱;利用基于信号重心的方法检测瞬态噪声,并根据是否存在瞬态噪声来修正稳态噪声谱;结合语音特征和谐波分析来估计语音存在概率;在语音概率估计的基础上,计算信号增益并作用于含噪语音,从而实现语音增强。本发明提出的方法,能够对瞬态噪声进行有效抑制,在综合语音增强性能和实时性指标方面,明显优于其它经典的语音增强方法。

    边缘计算中高能效的计算结点选择和计算任务分配方法

    公开(公告)号:CN110730232B

    公开(公告)日:2020-09-15

    申请号:CN201910976476.1

    申请日:2019-10-15

    Abstract: 边缘计算中高能效的计算结点选择和计算任务分配方法。首先确定计算任务量与时延违反概率之间的关系。当给定时延违反概率后,确定每个结点在规定的时间内能处理的最大计算量。当需要完成的计算任务的总计算量小于周围结点能提供的最大计算量总和时,进一步给出一种高能效的计算结点选择和计算任务分配方法,提高边缘计算的能效。若需要完成的计算任务的总计算量大于周围结点能提供的最大计算量总和时,该任务无法被完成,丢弃该任务。本发明在满足时延违反概率和总计算量的前提下,能够有效提升边缘计算的能量效率。

    边缘计算中高能效的计算结点选择和计算任务分配方法

    公开(公告)号:CN110730232A

    公开(公告)日:2020-01-24

    申请号:CN201910976476.1

    申请日:2019-10-15

    Abstract: 边缘计算中高能效的计算结点选择和计算任务分配方法。首先确定计算任务量与时延违反概率之间的关系。当给定时延违反概率后,确定每个结点在规定的时间内能处理的最大计算量。当需要完成的计算任务的总计算量小于周围结点能提供的最大计算量总和时,进一步给出一种高能效的计算结点选择和计算任务分配方法,提高边缘计算的能效。若需要完成的计算任务的总计算量大于周围结点能提供的最大计算量总和时,该任务无法被完成,丢弃该任务。本发明在满足时延违反概率和总计算量的前提下,能够有效提升边缘计算的能量效率。

Patent Agency Ranking