-
公开(公告)号:CN117809694B
公开(公告)日:2024-08-09
申请号:CN202410024330.8
申请日:2024-01-08
Applicant: 哈尔滨理工大学
IPC: G10L25/51 , G10L25/30 , G10L21/0208 , G10L15/06
Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。
-
公开(公告)号:CN115910073A
公开(公告)日:2023-04-04
申请号:CN202211186472.1
申请日:2022-09-27
Applicant: 哈尔滨理工大学
IPC: G10L17/18 , G10L17/02 , G10L17/04 , G10L17/22 , G06N3/044 , G06N3/045 , G06N3/048 , G06N3/08 , G06N3/084
Abstract: 本发明提出了一种基于双向注意力残差网络的语音欺诈检测方法,能够有效提升欺诈语音检测系统的识别性能,防止欺诈语音通过自动说话人验证系统(ASV)。在训练过程中,本发明首先对语音进行预处理,并提取常数Q变换(CQT)特征矩阵,将其作为残差网络(ResNet)的输入,利用ResNet提取浅层特征,然后将此特征输入双向注意力网络,以区分特征中不同维度的重要程度,从而得到区分性更强的特征表示。在测试阶段,利用训练好的网络模型作为真实语音与欺诈语音的分类器,对语音进行打分,根据打分结果对真实语音与欺诈语音进行分类。实验结果表明,本发明方法能够明显提升欺诈检测系统的性能,保护ASV系统免受不法用户的侵害。本发明可应用在语音处理和生物识别领域。
-
公开(公告)号:CN115910073B
公开(公告)日:2024-09-20
申请号:CN202211186472.1
申请日:2022-09-27
Applicant: 哈尔滨理工大学
IPC: G10L17/18 , G10L17/02 , G10L17/04 , G10L17/22 , G06N3/044 , G06N3/045 , G06N3/048 , G06N3/08 , G06N3/084
Abstract: 本发明提出了一种基于双向注意力残差网络的语音欺诈检测方法,能够有效提升欺诈语音检测系统的识别性能,防止欺诈语音通过自动说话人验证系统(ASV)。在训练过程中,本发明首先对语音进行预处理,并提取常数Q变换(CQT)特征矩阵,将其作为残差网络(ResNet)的输入,利用ResNet提取浅层特征,然后将此特征输入双向注意力网络,以区分特征中不同维度的重要程度,从而得到区分性更强的特征表示。在测试阶段,利用训练好的网络模型作为真实语音与欺诈语音的分类器,对语音进行打分,根据打分结果对真实语音与欺诈语音进行分类。实验结果表明,本发明方法能够明显提升欺诈检测系统的性能,保护ASV系统免受不法用户的侵害。本发明可应用在语音处理和生物识别领域。
-
公开(公告)号:CN117809694A
公开(公告)日:2024-04-02
申请号:CN202410024330.8
申请日:2024-01-08
Applicant: 哈尔滨理工大学
IPC: G10L25/51 , G10L25/30 , G10L21/0208 , G10L15/06
Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。
-
-
-