-
公开(公告)号:CN118116372A
公开(公告)日:2024-05-31
申请号:CN202410516807.4
申请日:2024-04-28
Applicant: 福州大学
Abstract: 本发明涉及一种面向语音关键词识别的二值化深度神经网络硬件加速系统,属于语音关键词识别领域。所述系统包括:MFCC模块,用于提取输入语音特征,并进行预处理;二值化深度神经网络模块,对MFCC模块预处理的语音特征进行识别以区分关键词和非关键词;所述二值化深度神经网络模块包括依次连接的输入层、全连接层FC1、全连接层FC2、全连接层FC3、归一化层、一维卷积层Conv1D、最大池化层Maxpool、输出层。与传统BNN相比,本发明对语音识别的结果处理过程进行增强;同时本发明通过利用连续语音帧之间的时间相关性,对神经网络的初步预测概率输出进行平滑等处理,有效提高了关键词识别的准确率。
-
公开(公告)号:CN118116372B
公开(公告)日:2024-07-09
申请号:CN202410516807.4
申请日:2024-04-28
Applicant: 福州大学
Abstract: 本发明涉及一种面向语音关键词识别的二值化深度神经网络硬件加速系统,属于语音关键词识别领域。所述系统包括:MFCC模块,用于提取输入语音特征,并进行预处理;二值化深度神经网络模块,对MFCC模块预处理的语音特征进行识别以区分关键词和非关键词;所述二值化深度神经网络模块包括依次连接的输入层、全连接层FC1、全连接层FC2、全连接层FC3、归一化层、一维卷积层Conv1D、最大池化层Maxpool、输出层。与传统BNN相比,本发明对语音识别的结果处理过程进行增强;同时本发明通过利用连续语音帧之间的时间相关性,对神经网络的初步预测概率输出进行平滑等处理,有效提高了关键词识别的准确率。
-