-
公开(公告)号:CN117373482A
公开(公告)日:2024-01-09
申请号:CN202311342515.5
申请日:2023-10-16
Applicant: 电子科技大学
IPC: G10L25/30 , G10L25/03 , G06N3/0464 , G06N3/084 , G10L21/0208 , G10L21/0216
Abstract: 本发明公开了一种基于改进残差网络的带噪合成语音检测方法,通过在传统的残差块上添加了一个特征增强层来代替恒等映射得到改进的残差块,基于改进残差块进行模型训练,得到已训练好的模型,将待测语音进行语音预处理并输入语谱图特征进行模型推断,获得真假语音的输出分数后,将真假判定结果返回给用户,完成语音检测。本发明的方法提出的改进的残差块提高了改进残差网络对于带噪合成语音的检测能力,通过特征增强层控制网络在不同深度时所倾向的噪声抑制和特征增强能力,相比于现有检测方法检测精度更高,适用于具有语音解锁功能的高精度设备及环境噪音较大的环境。
-
公开(公告)号:CN116597813A
公开(公告)日:2023-08-15
申请号:CN202310806527.2
申请日:2023-06-30
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于一维卷积神经网络的快速合成语音检测方法,包括以下步骤:S1、对语音数据集进行预处理;S2、预处理完成后进行语音特征提取,分别提取SFTF、CQT、DCT特征;S3、分别将STFT、CQT、DCT特征输入随机初始化后的神经网络模型值中进行训练;S4、将待识别的合成语音分别进行S1和S2的处理后,输入步骤S3训练好的神经网络模型中,得到最终的检测结果。本发明分别提取音频中的3种特征:STFT特征,CQT特征,DCT特征;然后通过3个神经网络模型分别对3种特征进行了拟合,然后对3个模型赋予不同的权值并测试,找到最合适的权重;相比于传统检测方法,本发明的方法检测精度更高,并且泛化性更强,能够检测更多类型的合成语音。
-
公开(公告)号:CN115860069A
公开(公告)日:2023-03-28
申请号:CN202211680433.7
申请日:2022-12-27
Applicant: 电子科技大学
IPC: G06N3/048 , G06N3/08 , G06N3/126 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开一种基于细粒度错误阻断的神经网络模型容错增强方法,应用于网络安全领域,针对现有的神经网络错误阻断方法都是以层为单位寻找阈值,而由于一层中的每个通道的阈值并不相同,因此会导致寻找到的阈值距离它的最优解存在一定的差距的问题;本发明首先分别向已经部署的神经网络模型注入单比特错误和多比特错误,并将原始权重以及带有错误的权重模型保存作为权重数据集;然后根据权重数据集,并利用遗传算法进行多次迭代求取神经网络每一层每个通道的阈值;最后根据求得的阈值生成自定义的激活函数,并替换到目标模型中,从而实现神经网络的容错增强。
-
-