-
公开(公告)号:CN110085249B
公开(公告)日:2021-03-16
申请号:CN201910385797.4
申请日:2019-05-09
Applicant: 南京工程学院
IPC: G10L21/0232 , G10L21/0264 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于注意力门控的循环神经网络的单通道语音增强方法,包括对带噪的单通道语音进行分帧加窗,提取38维信号特征;构建用于单通道语音增强的深度循环神经网络;利用纯净语音库和噪声库构建训练数据集;训练构建的深度循环神经网络;将提取的带噪语音特征输入训练好的深度循环神经网络,输出带噪语音的频带增益估计值,并进行平滑、内插得到内插增益;将内插增益作用于带噪的单通道语音,得到增强后的语音频谱。本发明能够有效抑制包括非平稳噪声在内的噪声,同时保持足够低的计算复杂度,从而能够用于实时的单通道语音增强,方法巧妙,构思新颖,具有良好的应用前景。
-
公开(公告)号:CN110111803B
公开(公告)日:2021-02-19
申请号:CN201910385769.2
申请日:2019-05-09
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于自注意多核最大均值差异的迁移学习语音增强方法,包括从原始语音中提取GFCC特征,并作为深度神经网络的输入特征;利用带噪语音与干净语音信息计算傅里叶变换域的理想浮值掩蔽,并作为深度神经网络的训练目标;构建基于深层神经网络的语音增强模型;构建自注意多核最大均值差异的迁移学习语音增强模型;训练自注意多核最大均值差异的迁移学习语音增强模型;输入目标域带噪语音的帧级特征,重建增强语音波形。本发明在多核最大均值差异前端添加自注意力算法,通过最小化源域注意到的特征和目标域注意到的特征之间的多核最大均值差异,实现对无标签的目标域的迁移学习,提高语音增强性能,具有良好的应用前景。
-
公开(公告)号:CN108520753A
公开(公告)日:2018-09-11
申请号:CN201810159072.9
申请日:2018-02-26
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于卷积双向长短时记忆网络的语音测谎方法,包括将整段语音进行统一归一化处理;根据数据库标签对统一归一化处理的语音进行切分;对切分的语音加窗分帧处理;建立变长数据的计算方式;将卷积操作引入长短时记忆网络中;构建完整的语音测谎网络模型;训练语音测谎网络模型,并加窗分帧处理后的语音进行测谎评测。本发明通过将卷积操作引入长短时记忆网络中,构建完整的语音测谎网络模型,实现深度学习,从原始语音数据中提取适用于谎言检测的特征,以提高谎言检测的性能,具有良好的应用前景。
-
公开(公告)号:CN106901758A
公开(公告)日:2017-06-30
申请号:CN201710099098.4
申请日:2017-02-23
Applicant: 南京工程学院
IPC: A61B5/16
Abstract: 本发明公开了一种基于卷积神经网络的言语置信度评测方法。该方法首先对采集的语音样本进行分帧,并提取每帧的梅尔倒谱系数,构成单通道梅尔倒谱系数图像;然后构建六层卷积神经网络,构建前三层为使用尺寸不同的卷积滤波器的卷积层,第四层为生成全局特征图的聚合层,第五层和第六层为由2048个线性修正单元的全连层;最后将梅尔倒谱系数图像输入构建的卷积神经网络进行言语置信度评测。实验结果显示,该置信度评测方法对谎言的识别率达到73%。
-
公开(公告)号:CN103152672B
公开(公告)日:2015-04-15
申请号:CN201310110995.2
申请日:2013-04-03
Applicant: 南京工程学院
IPC: H04R3/00
Abstract: 本发明提出了一种微麦克风阵列接收信号压缩编码及信号恢复方法。其具体方法是对每个时刻微麦克风阵列接收的信号进行压缩变换,并对压缩变换后的信号进行编码。压缩变换矩阵为对角元为1的下三角阵,其非对角元系数由自适应过程更新。自适应过程及其代价函数在更新过程中最小化压缩变换后的信号能量,对各麦克风阵元接收信号解相关,消除各阵元信号之间的冗余信息。每一时刻的压缩编码信号可以通过压缩变换矩阵的逆矩阵恢复出原始接收信号。由于压缩变换矩阵始终保持对角元为1的下三角阵,所以其逆矩阵始终存在,信号恢复过程稳定可靠。
-
公开(公告)号:CN101458290A
公开(公告)日:2009-06-17
申请号:CN200810136691.2
申请日:2008-12-31
Applicant: 江苏省电力公司苏州供电公司 , 南京工程学院 , 赵力
IPC: G01R31/02
Abstract: 本发明涉及一种基于调频数字编码的多芯电缆测序方法及其装置,该装置由发送器和接收器组成,分别连接待测多芯电缆的两端;测量时,发射器对每一根待测电缆设计数字编码信号,并对编码信号进行频率调制后发送到待测电缆上;接收端利用测量探头连接任意两根电缆,两根电缆的接收信号通过差分电路获得其中标识为“+”端的电缆的有效接收信号,对有效接收信号进行解调,从而获得所连接的电缆序号并显示结果。采用本发明测量方法的测量装置,体积较小,便于现场使用,在测量时不需使用公共参考线,而且采用本发明的测量方法使得测量的可靠性更高,可进行远距离测试。
-
-
公开(公告)号:CN112185423A
公开(公告)日:2021-01-05
申请号:CN202011041520.9
申请日:2020-09-28
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于多头注意力机制的语音情感识别方法,包括如下步骤:从原始语音数据中提取具有时序信息的语音特征;建立具有处理时序能力的LSTM模型;用多头注意力对LSTM模型的输出在时间维度和特征维度上分别进行注意力加权,区分不同时间片段内情感的饱和度以及不同特征对情感的识别能力;将时间维度和特征维度分别加权后的输出输入全连接层和softmax层得到语音情感类别;用已知的原始语音数据样本训练情感识别模型,并对识别性能进行评测;将未知的原始语音数据样本输入训练好的情感识别模型,输出对应的语音情感类别。本发明通过多头注意力机制来强化LSTM模型的输出,以提高语音情感识别性能,具有良好的应用前景。
-
公开(公告)号:CN110111803A
公开(公告)日:2019-08-09
申请号:CN201910385769.2
申请日:2019-05-09
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于自注意多核最大均值差异的迁移学习语音增强方法,包括从原始语音中提取GFCC特征,并作为深度神经网络的输入特征;利用带噪语音与干净语音信息计算傅里叶变换域的理想浮值掩蔽,并作为深度神经网络的训练目标;构建基于深层神经网络的语音增强模型;构建自注意多核最大均值差异的迁移学习语音增强模型;训练自注意多核最大均值差异的迁移学习语音增强模型;输入目标域带噪语音的帧级特征,重建增强语音波形。本发明在多核最大均值差异前端添加自注意力算法,通过最小化源域注意到的特征和目标域注意到的特征之间的多核最大均值差异,实现对无标签的目标域的迁移学习,提高语音增强性能,具有良好的应用前景。
-
公开(公告)号:CN110085249A
公开(公告)日:2019-08-02
申请号:CN201910385797.4
申请日:2019-05-09
Applicant: 南京工程学院
IPC: G10L21/0232 , G10L21/0264 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于注意力门控的循环神经网络的单通道语音增强方法,包括对带噪的单通道语音进行分帧加窗,提取38维信号特征;构建用于单通道语音增强的深度循环神经网络;利用纯净语音库和噪声库构建训练数据集;训练构建的深度循环神经网络;将提取的带噪语音特征输入训练好的深度循环神经网络,输出带噪语音的频带增益估计值,并进行平滑、内插得到内插增益;将内插增益作用于带噪的单通道语音,得到增强后的语音频谱。本发明能够有效抑制包括非平稳噪声在内的噪声,同时保持足够低的计算复杂度,从而能够用于实时的单通道语音增强,方法巧妙,构思新颖,具有良好的应用前景。
-
-
-
-
-
-
-
-
-