-
公开(公告)号:CN119832917A
公开(公告)日:2025-04-15
申请号:CN202510154870.2
申请日:2025-02-12
Applicant: 北京邮电大学
IPC: G10L17/04 , G10L17/18 , G10L25/51 , G10L25/30 , G06F18/241 , G06N3/045 , G06N3/048 , G06N3/0985 , G06N3/084
Abstract: 一种声纹识别与语音欺骗检测的集成方法,属于声纹识别领域,包括:将注册语音和测试语音同时输入到声纹识别子系统,测试语音输入到语音欺骗检测子系统,由声纹识别子系统输出注册语音声纹嵌入和测试语音声纹嵌入,语音欺骗检测子系统输出测试语音欺骗嵌入;将嵌入输入到基于交叉注意力机制的后端融合分类器,在嵌入之间使用交叉注意力机制进行融合以模拟全局特征交互,捕获两种任务的互补信息;经过基于模型无关元学习的集成模型分类后输出分类结果。本发明结合交叉注意力融合机制和模型无关元学习技术使模型能根据语音中的声纹信息判断说话人身份,抵御语音合成等恶意攻击,使模型能快速且灵活地适应任务场景,提升模型适应性与泛化能力。
-
公开(公告)号:CN119990261A
公开(公告)日:2025-05-13
申请号:CN202510154750.2
申请日:2025-02-12
Applicant: 北京邮电大学
IPC: G06N3/098 , G06N3/096 , G06N3/0455 , G06N3/0464 , G06T11/00 , G06F18/23213
Abstract: 一种基于风格迁移探索的自适应联邦学习方法,属于联邦学习领域,包括:建立风格共享中心;选择性风格迁移;使用解码器将风格迁移后的特征信息转换为具有其他参与方风格的图像;在各参与方的原始样本数据中进行风格探索,得到新的风格信息特征;利用AdaIN模型将探索到的风格信息特征有选择地迁移到原始样本数据中;分布式训练,生成局部模型;利用公共均匀分布数据集对各参与方上传的模型进行验证,计算出各参与方模型得分,再利用PDVFedMul聚合算法对局部模型进行聚合,从而得到新一轮的全局模型参数。本发明提升了模型的泛化能力,增强了模型的鲁棒性,为模型聚合提供了更加合理的权值分配方案,提升了模型性能。
-
公开(公告)号:CN119673181A
公开(公告)日:2025-03-21
申请号:CN202411861362.X
申请日:2024-12-17
Applicant: 北京邮电大学
IPC: G10L19/028 , G10L15/26 , G10L15/02 , G10L15/22 , G10L25/87 , G10L15/04 , G10L13/08 , G10L13/02 , H04L9/40 , G10L15/08
Abstract: 一种基于语音内容脱敏和声纹匿名化的说话人匿名化方法,属于智能语音领域,包括:对原始语音进行语音识别;对文本进行预处理;使用TextRank算法进行关键词提取;进行安全词替换,得到语音内容脱敏后的文本;使用x‑vector对原始语音进行声纹特征提取;使用WGAN对声纹特征进行声纹匿名化,得到匿名化声纹;进行语音合成,得到安全语音。本发明能够在不影响语义的情况下,将语音内容的敏感词替换为安全词;同时利用WGAN算法生成匿名声纹特征,提供了稳定且高质量的生成样本;本发明具有高性能的语音特征提取能力,对环境噪声和语音变化具有较强的鲁棒性,适用于大规模的语音数据库。
-
-