建立声纹模型的方法、装置、计算机设备和存储介质
摘要:
本申请揭示了一种建立声纹模型的方法、装置、计算机设备和存储介质,其中方法包括:对输入的目标用户的语音信号分帧,分别提取分帧后的语音信号的语音声学特征;将多个所述语音声学特征输入基于神经网络训练的深度学习模型中,集合成至少一个簇结构;计算至少一个所述簇结构的平均值和标准差;将所述平均值和标准差进行坐标变换以及激活函数计算,得到特征向量参数;将所述特征向量参数以及所述目标用户的身份验证结果输入预设的基础模型,得到与所述目标用户对应的声纹模型。本申请提取出的语音声学特征基于深度神经网络训练中得出簇结构,然后将簇结构进行坐标映射和激活函数计算,得出的声纹模型,可以降低声纹模型的声音识别错误率。
0/0