建立声纹模型的方法、装置、计算机设备和存储介质

发明授权

CN108806696B 建立声纹模型的方法、装置、计算机设备和存储介质有权

请登陆查看更多内容

专利标题： 建立声纹模型的方法、装置、计算机设备和存储介质
申请号： CN201810433792.X

申请日： 2018-05-08
公开(公告)号： CN108806696B

公开(公告)日： 2020-06-05
发明人: 蔡元哲 , 王健宗 , 程宁 , 肖京
申请人： 平安科技(深圳)有限公司
申请人地址： 广东省深圳市福田区八卦岭工业区平安大厦六楼
专利权人： 平安科技(深圳)有限公司
当前专利权人： 平安科技(深圳)有限公司
当前专利权人地址： 广东省深圳市福田区八卦岭工业区平安大厦六楼
代理机构： 深圳市明日今典知识产权代理事务所
代理商 王杰辉
主分类号： G10L17/04
IPC分类号： G10L17/04 ; G10L17/02 ; G10L17/18

摘要：

本申请揭示了一种建立声纹模型的方法、装置、计算机设备和存储介质，其中方法包括：对输入的目标用户的语音信号分帧，分别提取分帧后的语音信号的语音声学特征；将多个所述语音声学特征输入基于神经网络训练的深度学习模型中，集合成至少一个簇结构；计算至少一个所述簇结构的平均值和标准差；将所述平均值和标准差进行坐标变换以及激活函数计算，得到特征向量参数；将所述特征向量参数以及所述目标用户的身份验证结果输入预设的基础模型，得到与所述目标用户对应的声纹模型。本申请提取出的语音声学特征基于深度神经网络训练中得出簇结构，然后将簇结构进行坐标映射和激活函数计算，得出的声纹模型，可以降低声纹模型的声音识别错误率。

摘要（英）：

A method and an apparatus for establishing a voice print model, a computer device, and a storage medium, the method comprising: combining voice acoustic features in a voice signal into a plurality of cluster structures; after calculating the average value and standard deviation of the plurality of cluster structures, performing coordinate transformation and an activation function calculation to obtain eigenvector parameters; and, on the basis of the eigenvector parameters, obtaining a voice print model. The present voice print model can reduce the voice recognition error rate of voice print models.

公开/授权文献

CN108806696A 建立声纹模型的方法、装置、计算机设备和存储介质公开/授权日：2018-11-13

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L17/00	讲话者辨认或验证
G10L17/04	.训练，登记或模型的建立