-
公开(公告)号:CN114220445A
公开(公告)日:2022-03-22
申请号:CN202111362013.X
申请日:2021-11-17
Applicant: 南京邮电大学
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L21/0264
Abstract: 本发明公开了一种基于非均匀图子带划分的语音图自适应谱减法,在原有图谱减法的基础上,根据语音的图频率域特性对图频率进行非均匀图频率域划分,形成所谓的图子带信号,使得不同图频率范围下的图子带宽度不同。然后,根据图子带上的语音分布,对语音信号进行子带信噪比估计,以此为依据进行图子带筛选,对不同的图子带采取自适应的谱减策略,以提高算法的语音增强性能。本发明的噪声性能较图谱减法以及子带谱减法均有明显的提升。
-
公开(公告)号:CN119724233A
公开(公告)日:2025-03-28
申请号:CN202411579346.1
申请日:2024-11-07
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于特征重叠分割图卷积网络的语音反欺骗方法、系统、装置及存储介质,属于语音图信号处理技术领域。方法包括获取原始语音数据;将原始语音数据输入预先训练好的语音反欺骗网络模型,得到语音嵌入特征;基于语音嵌入特征得到语音真实性概率,并将语音真实性概率与设定阈值进行比较,判断原始语音是否为真实语音。本发明通过语音反欺骗网络模型中的特征重叠分割图卷积网络模块,有效捕捉原始语音数据特征中不同区域的细节信息,并能够同时提取局部邻域特征和全局信息,增强特征表示的丰富性,防止重要信息的丢失,有效提升真实语音的判断准确率和语音反欺骗网络模型的鲁棒性。
-
公开(公告)号:CN119694320A
公开(公告)日:2025-03-25
申请号:CN202510200876.9
申请日:2025-02-24
Applicant: 南京邮电大学
Abstract: 本发明公开了一种端到端的深度伪造语音检测系统及方法,属于语音处理技术领域。其检测系统分为前端嵌入提取网络和后端分类网络两部分。前端嵌入提取网络采用前端预训练模型来提取语音信号的不同尺度的全局语义特征,并采用特征融合模块对提取的不同尺度的全局语义特征进行深度融合,进一步增强特征嵌入的表达能力。后端分类网络采用单层长短期记忆分类网络对融合特征进行分类,并使用交叉熵损失和中心损失进行联合优化,最终判断语音是真实的还是伪造的。本发明应用于语音安全、身份认证、语音助手等场景中,能够提供更加准确、鲁棒和具有良好泛化能力的深度伪造语音检测方案,对于提升语音识别系统的安全性和可信度,具有重要意义。
-
-