-
公开(公告)号:CN117809694B
公开(公告)日:2024-08-09
申请号:CN202410024330.8
申请日:2024-01-08
Applicant: 哈尔滨理工大学
IPC: G10L25/51 , G10L25/30 , G10L21/0208 , G10L15/06
Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。
-
公开(公告)号:CN118486330B
公开(公告)日:2024-11-05
申请号:CN202410582116.4
申请日:2024-05-11
Applicant: 哈尔滨理工大学
Abstract: 一种基于关联特征判别性融合网络的伪造语音检测方法及系统,属于语音处理及生物识别技术领域。本发明首先对语音进行预处理并CQT特征,将其作为双向注意力网络和SCG‑Res2Net50这个两个平行网络的输入,在训练阶段通过关联特征判别性融合方法进行网络参数初始化,将初始化投影矩阵参数与原特征相乘得出转换后的新特征,再将两个特征拼接,然后将此拼接后的特征输入全连接层分类,得到训练好的网络模型,用于作为真实语音与欺诈语音的分类器,根据全连接层输出中的两个数值相减的结果进行真实语音与伪造语音的分类。
-
公开(公告)号:CN118486330A
公开(公告)日:2024-08-13
申请号:CN202410582116.4
申请日:2024-05-11
Applicant: 哈尔滨理工大学
Abstract: 一种基于关联特征判别性融合网络的伪造语音检测方法及系统,属于语音处理及生物识别技术领域。本发明首先对语音进行预处理并CQT特征,将其作为双向注意力网络和SCG‑Res2Net50这个两个平行网络的输入,在训练阶段通过关联特征判别性融合方法进行网络参数初始化,将初始化投影矩阵参数与原特征相乘得出转换后的新特征,再将两个特征拼接,然后将此拼接后的特征输入全连接层分类,得到训练好的网络模型,用于作为真实语音与欺诈语音的分类器,根据全连接层输出中的两个数值相减的结果进行真实语音与伪造语音的分类。
-
公开(公告)号:CN117809694A
公开(公告)日:2024-04-02
申请号:CN202410024330.8
申请日:2024-01-08
Applicant: 哈尔滨理工大学
IPC: G10L25/51 , G10L25/30 , G10L21/0208 , G10L15/06
Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。
-
-
-