-
公开(公告)号:CN104732978A
公开(公告)日:2015-06-24
申请号:CN201510107647.9
申请日:2015-03-12
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
Abstract: 一种智能语音领域的基于联合深度学习的文本相关的说话人识别方法,首先从待检测音频中提出得到FBANK系数,经帧扩展后输入神经网络进行计算,得到待测音频的j‐vector;再训练LDA模型并得到预测阈值,最后将待测试的说话人的注册音频的j‐vector和待测试的说话人的测试音频的j‐vector归一化后输入带有预测阈值的LDA模型,并得到预测结果。本发明能够极大地提高文本相关的说话人识别的精确度。