语音增强网络的训练方法、装置、存储介质及计算机设备
摘要:
本申请公开一种语音增强网络的训练方法,包括:获取训练集,训练集包括多个训练样本,训练样本包括样本参考语音、样本比对语音和混合语音;对样本参考语音进行声纹提取,得到样本声纹向量;对混合语音进行音频特征提取,得到样本音频特征;由语音增强网络基于样本声纹向量和样本音频特征进行增强处理,输出针对样本发声对象的预测音频特征;根据预测音频特征和样本比对语音对应的比对音频特征,确定语音增强网络的目标损失;基于目标损失迭代更新语音增强网络的权重参数,直至达到训练结束条件。本申请应用人工智能技术,能够基于源自同一发声对象的样本参考语音和样本比对语音,训练出用于抑制干扰人声的语音增强网络,有效提高语音增强的质量。
0/0