用于声纹识别的硬件友好的权重三值化神经网络训练方法

    公开(公告)号:CN114974266A

    公开(公告)日:2022-08-30

    申请号:CN202210553923.4

    申请日:2022-05-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于声纹识别的硬件友好的权重三值化神经网络训练方法。对前端硅麦采集到的语音音频按比例添加噪声并进行混合后,通过梅尔频率倒谱系数特征提取处理模块处理,得到混合噪声的语音数据集。使用该数据集以硬件友好为目标进行神经网络训练,训练过程中权重和量化阈值同步更新,并使用量化阈值将权重量化为三值权重,训练完成后将权重二次量化为±1和0的标准三值,以得到训练完成的硬件友好的三值权重神经网络,并可以实现硬件友好的声纹识别系统的功能。以硬件友好为原则,使用本方法训练得到的神经网络权重被量化为标准三值,神经网络推理计算过程中的乘法操作少,且可以适应多背景噪声的环境,并且适合于在硬件环境上进行部署。

Patent Agency Ranking