-
公开(公告)号:CN114974266A
公开(公告)日:2022-08-30
申请号:CN202210553923.4
申请日:2022-05-19
Applicant: 东南大学
Abstract: 本发明公开了一种用于声纹识别的硬件友好的权重三值化神经网络训练方法。对前端硅麦采集到的语音音频按比例添加噪声并进行混合后,通过梅尔频率倒谱系数特征提取处理模块处理,得到混合噪声的语音数据集。使用该数据集以硬件友好为目标进行神经网络训练,训练过程中权重和量化阈值同步更新,并使用量化阈值将权重量化为三值权重,训练完成后将权重二次量化为±1和0的标准三值,以得到训练完成的硬件友好的三值权重神经网络,并可以实现硬件友好的声纹识别系统的功能。以硬件友好为原则,使用本方法训练得到的神经网络权重被量化为标准三值,神经网络推理计算过程中的乘法操作少,且可以适应多背景噪声的环境,并且适合于在硬件环境上进行部署。
-
公开(公告)号:CN112767949B
公开(公告)日:2022-04-26
申请号:CN202110060398.8
申请日:2021-01-18
Applicant: 东南大学
Abstract: 本发明公开了一种基于二值权重卷积神经网络的声纹识别系统,其功能为对采集到的语音信号进行处理判断是否为目标说话人,并输出识别结果。其核心结构包括网络控制模块、权重存储片上静态存储器、数据存储片上静态存储器、通用异步收发传输器接口uart模块、梅尔频率倒谱系数特征提取处理MFCC模块、并转串模块。本发明采用高度复用的二值权重卷积神经网络系统,实现了较好的声纹识别效果同时有效降低了整体计算的功耗和延时。
-
公开(公告)号:CN112863520B
公开(公告)日:2023-10-24
申请号:CN202110060392.0
申请日:2021-01-18
Applicant: 东南大学
Abstract: 本发明公开了一种二值权重卷积神经网络模块及其用于声纹识别的方法。属于人工智能神经网络技术领域。其功能为对采集到的语音特征进行二值化的卷积计算与全连接计算,采用符号判断方式判断输入语音中是否含有目标说话人,并输出判断结果。其核心结构包括地址生成单元、状态机控制单元和复用计算单元。本发明采用二值化的卷积神经网络,极大减少了计算过程中的乘法操作,通过状态机控制单元控制整个网络的操作,通过判断全连接神经元的符号进行说话人判断,简单有效。模块化程度高,结构简单,可行性好,实现了较好的声纹识别效果同时有效降低了整体计算的功耗和延时。
-
公开(公告)号:CN112863520A
公开(公告)日:2021-05-28
申请号:CN202110060392.0
申请日:2021-01-18
Applicant: 东南大学
Abstract: 本发明公开了一种二值权重卷积神经网络模块及其用于声纹识别的方法。属于人工智能神经网络技术领域。其功能为对采集到的语音特征进行二值化的卷积计算与全连接计算,采用符号判断方式判断输入语音中是否含有目标说话人,并输出判断结果。其核心结构包括地址生成单元、状态机控制单元和复用计算单元。本发明采用二值化的卷积神经网络,极大减少了计算过程中的乘法操作,通过状态机控制单元控制整个网络的操作,通过判断全连接神经元的符号进行说话人判断,简单有效。模块化程度高,结构简单,可行性好,实现了较好的声纹识别效果同时有效降低了整体计算的功耗和延时。
-
-
-