-
公开(公告)号:CN116778910A
公开(公告)日:2023-09-19
申请号:CN202310505872.2
申请日:2023-05-06
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/28 , G06F18/2135 , G06F18/241 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种语音检测方法,包括:获取目标语音,将所述目标语音进行预处理,所述预处理包括预加重、分帧及加窗;确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征;基于所述第一声道特征、第一声源波特征和多种第一相关特征确定所述第一主成分特征;将所述第一主成分特征输入训练好的分类器,输出分类的结果,所述分类结果为伪造语音,或自然语音。本申请利用伪造语音在基频处留下的痕迹信息,利用伪造语音与自然语音在声源和声道特征上的差异以实现伪造语音检测。使用主成分分析的方法分别对声源和声道特征进行筛选,选取具有较高相关性的主成分作为特征,减少特征维度和冗余特征,提高模型的泛化能力和效率。
-
公开(公告)号:CN119495321A
公开(公告)日:2025-02-21
申请号:CN202411703134.X
申请日:2024-11-26
Applicant: 中国科学院声学研究所
Abstract: 本申请提供了一种基于多尺度编码器图网络的伪造语音检测方法及系统,该方法包括:采集训练模型使用的语音信号;使用Wav2Vec模型提取特征;将特征送入图网络进行时频域特征关系建模,将图网络输出的时频特征拼接送入分类层进行真伪分类判决,得到教师模型;使用训练语音训练教师模型;构建学生模型;在学生模型的Transformer层中插入LoRA适配器模块;使用真实样本训练学生模型,其训练目标为教师模型的真实样本分布;采集待测试的目标语音并输入教师模型和学生模型得到隐层特征,并计算余弦相似度,与先验阈值进行比较获得目标语音伪造语音检测结果。本申请的优势在于:提升了伪造语音检测系统的性能和鲁棒性。
-
公开(公告)号:CN119580770A
公开(公告)日:2025-03-07
申请号:CN202411692866.3
申请日:2024-11-25
Applicant: 中国科学院声学研究所
Abstract: 本申请提供了一种基于声门流特征和声纹特征的伪造语音检测方法及系统,该方法包括:采集训练模型使用的语音信号;使用预训练ECAPA‑TDNN系统提取声纹特征;通过逆滤波方法提取声门流特征;将声门流特征输入预训练的wav2vec提取声门流鲁棒性特征;将声门流鲁棒性特征送入二维卷积网络进行时频域特征关系建模,并与声纹特征拼接,将拼接特征拼接并送入分类层进行语音真伪分类判决;使用训练语音训练基于声门流特征和声纹特征的伪造语音检测系统;采集待测试的目标语音并同样地进行声门流和声纹特征提取,通过二维时频网络并输入分类层,获得最终的伪造语音检测结果。本申请的优势在于:提升了伪造语音检测系统的性能和鲁棒性。
-
公开(公告)号:CN116959425A
公开(公告)日:2023-10-27
申请号:CN202310746199.1
申请日:2023-06-21
Applicant: 中国科学院声学研究所
Abstract: 本发明提供一种鲁棒的伪造语音算法的溯源方法及装置。该方法包括:利用训练数据集训练针对伪造语音算法的分类器;利用训练好的分类器处理所述训练数据集,得到所述分类器中的隐层针对所述各条伪造语音生成的隐层特征;利用训练好的分类器处理待检测的目标语音信号,得到所述分类器中的隐层生成的目标隐层特征和所述分类器的输出层输出的目标分类结果;分别计算所述目标隐层特征与若干隐层特征的距离,并确定其中的最短距离;当所述最短距离大于或等于预设阈值时,将所述目标分类结果作为所述目标语音信号的最终分类结果。如此,可以使用声码器生成伪造算法识别的训练集。引入最邻近节点算法,通过最邻近距离的分布区分训练集中不存在的分布外数据。
-
-
-