-
公开(公告)号:CN108831486A
公开(公告)日:2018-11-16
申请号:CN201810518855.1
申请日:2018-05-25
Applicant: 南京邮电大学
Abstract: 本发明揭示了一种基于DNN与GMM模型的说话人识别方法,包括如下步骤:在给定特征参数MFCC的前提下,基于GMM-SVM提取超矢量实现数据降维,并拟构建相关超矢量来提取携带更丰富的说话人身份信息的特征;构造深度信念网络体系结构来提取说话人深度特征;结合相关超矢量和瓶颈特征以构建新的说话人辨认系统。应用本发明的该说话人识别方法,较之于传统此类单独方法具备突出的实质性特点和显著的进步性:该方法弥补了传统特征参数不能挖掘语音信号深层结构信息的缺点;与传统GMM超矢量相比,相关超矢量在实现数据降维的同时在一定程度上提高了识别率,并且减少了系统建模时间。
-
公开(公告)号:CN110459225B
公开(公告)日:2022-03-22
申请号:CN201910748773.0
申请日:2019-08-14
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于CNN融合特征的说话人辨认系统,该系统对输入语音信号进行预处理;再利用语谱图对卷积神经网络进行训练;最后寻找最优特征后进行特征融合。该方法克服了现有语音说话人识别系统的不足,与传统基于单一深度特征的说话人系统相比较,在不增加系统训练复杂度的前提下,可以从深浅不同的层次对说话人身份信息进行更加全面地描述,从而使得系统的识别率更高,性能得到进一步提升,可以很好地应用于智能说话人身份信息的辨认。
-
公开(公告)号:CN110459225A
公开(公告)日:2019-11-15
申请号:CN201910748773.0
申请日:2019-08-14
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于CNN融合特征的说话人辨认系统,该系统对输入语音信号进行预处理;再利用语谱图对卷积神经网络进行训练;最后寻找最优特征后进行特征融合。该方法克服了现有语音说话人识别系统的不足,与传统基于单一深度特征的说话人系统相比较,在不增加系统训练复杂度的前提下,可以从深浅不同的层次对说话人身份信息进行更加全面地描述,从而使得系统的识别率更高,性能得到进一步提升,可以很好地应用于智能说话人身份信息的辨认。
-
公开(公告)号:CN108831486B
公开(公告)日:2023-06-02
申请号:CN201810518855.1
申请日:2018-05-25
Applicant: 南京邮电大学
Abstract: 本发明揭示了一种基于DNN与GMM模型的说话人识别方法,包括如下步骤:在给定特征参数MFCC的前提下,基于GMM‑SVM提取超矢量实现数据降维,并拟构建相关超矢量来提取携带更丰富的说话人身份信息的特征;构造深度信念网络体系结构来提取说话人深度特征;结合相关超矢量和瓶颈特征以构建新的说话人辨认系统。应用本发明的该说话人识别方法,较之于传统此类单独方法具备突出的实质性特点和显著的进步性:该方法弥补了传统特征参数不能挖掘语音信号深层结构信息的缺点;与传统GMM超矢量相比,相关超矢量在实现数据降维的同时在一定程度上提高了识别率,并且减少了系统建模时间。
-
-
-