-
公开(公告)号:CN119990261A
公开(公告)日:2025-05-13
申请号:CN202510154750.2
申请日:2025-02-12
Applicant: 北京邮电大学
IPC: G06N3/098 , G06N3/096 , G06N3/0455 , G06N3/0464 , G06T11/00 , G06F18/23213
Abstract: 一种基于风格迁移探索的自适应联邦学习方法,属于联邦学习领域,包括:建立风格共享中心;选择性风格迁移;使用解码器将风格迁移后的特征信息转换为具有其他参与方风格的图像;在各参与方的原始样本数据中进行风格探索,得到新的风格信息特征;利用AdaIN模型将探索到的风格信息特征有选择地迁移到原始样本数据中;分布式训练,生成局部模型;利用公共均匀分布数据集对各参与方上传的模型进行验证,计算出各参与方模型得分,再利用PDVFedMul聚合算法对局部模型进行聚合,从而得到新一轮的全局模型参数。本发明提升了模型的泛化能力,增强了模型的鲁棒性,为模型聚合提供了更加合理的权值分配方案,提升了模型性能。
-
公开(公告)号:CN119673181A
公开(公告)日:2025-03-21
申请号:CN202411861362.X
申请日:2024-12-17
Applicant: 北京邮电大学
IPC: G10L19/028 , G10L15/26 , G10L15/02 , G10L15/22 , G10L25/87 , G10L15/04 , G10L13/08 , G10L13/02 , H04L9/40 , G10L15/08
Abstract: 一种基于语音内容脱敏和声纹匿名化的说话人匿名化方法,属于智能语音领域,包括:对原始语音进行语音识别;对文本进行预处理;使用TextRank算法进行关键词提取;进行安全词替换,得到语音内容脱敏后的文本;使用x‑vector对原始语音进行声纹特征提取;使用WGAN对声纹特征进行声纹匿名化,得到匿名化声纹;进行语音合成,得到安全语音。本发明能够在不影响语义的情况下,将语音内容的敏感词替换为安全词;同时利用WGAN算法生成匿名声纹特征,提供了稳定且高质量的生成样本;本发明具有高性能的语音特征提取能力,对环境噪声和语音变化具有较强的鲁棒性,适用于大规模的语音数据库。
-