-
公开(公告)号:CN119314497B
公开(公告)日:2025-04-01
申请号:CN202411834367.3
申请日:2024-12-13
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G10L19/018
Abstract: 本申请涉及一种面向语音合成系统的模型水印方法、装置、计算机设备和存储介质,其中,该方法包括:基于预训练的语音合成模型和微调的说话人识别模型,构建域内的水印触发样本;并基于水印触发样本构建对应的水印植入数据集;基于微调的说话人识别模型,将水印植入数据集植入语音合成模型,得到标记化模型;基于标记化模型,筛选出目标水印触发样本。通过本申请,解决了相关技术中存在水印与语音合成主任务关联性不强,导致水印在模型微调过程中易丢失,利用构建域内的水印触发样本,从数据层面强迫水印触发任务与模型主任务之间的强耦合,提高标记化模型中水印的鲁棒性,使得目标水印触发样本保持稳定性和有效性。
-
公开(公告)号:CN119314497A
公开(公告)日:2025-01-14
申请号:CN202411834367.3
申请日:2024-12-13
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G10L19/018
Abstract: 本申请涉及一种面向语音合成系统的模型水印方法、装置、计算机设备和存储介质,其中,该方法包括:基于预训练的语音合成模型和微调的说话人识别模型,构建域内的水印触发样本;并基于水印触发样本构建对应的水印植入数据集;基于微调的说话人识别模型,将水印植入数据集植入语音合成模型,得到标记化模型;基于标记化模型,筛选出目标水印触发样本。通过本申请,解决了相关技术中存在水印与语音合成主任务关联性不强,导致水印在模型微调过程中易丢失,利用构建域内的水印触发样本,从数据层面强迫水印触发任务与模型主任务之间的强耦合,提高标记化模型中水印的鲁棒性,使得目标水印触发样本保持稳定性和有效性。
-
公开(公告)号:CN119152862B
公开(公告)日:2025-04-04
申请号:CN202411604235.1
申请日:2024-11-12
Applicant: 浙江大学
IPC: G10L19/018 , G10L25/48 , G10L25/30
Abstract: 本发明公开了一种隐私保护的深度语音数字水印流式嵌入与检测方法,基于端云协同处理环境,有效隔离语音内容中的用户敏感信息与水印信息,同时实现流式嵌入、区间标注、防水印伪造、信道鲁棒等有益效果,支持语音内容版权声明、伪造样本标识等场景,服务第三方水印嵌入和检测应用,在整个水印嵌入阶段,服务器端仅根据水印信息生成通用水印数据,从而避免了用户隐私信息的泄露风险。在检测环节,接收端用户端采用第三深度神经网络对音频内容进行脱敏处理,使得服务器端仅能通过处理后的脱敏数据来推断水印的存在,隔绝了用户原始语音数据与服务器端的直接接触,显著提升了用户隐私保护水平,提高用户与第三方检测平台之间的信任感。
-
公开(公告)号:CN118824256A
公开(公告)日:2024-10-22
申请号:CN202411091594.1
申请日:2024-08-09
Applicant: 浙江大学计算机创新技术研究院
Abstract: 本发明公开了一种基于声纹识别系统服务拒绝后门的安全性测试方法和装置。本发明采用多种位置无关的环境音作为触发器,经过环境噪声对数据集做数据增强后,通过构建伪目标说话人的方式毒化数据集,再微调预训练模型以注入后门,微调过程中引入的多任务损失降低了后门植入的成本。受感染的声纹识别系统部署后,在物理空间通过触发器进行后门激活测试,根据已注册的合法用户是否会被系统拒绝从而验证目标声纹识别系统是否存在后门脆弱性。本发明综合考虑了现实条件下的物理有效性,触发可控性和感知隐蔽性,能够完成声纹识别系统的后门脆弱性的前置性验证。
-
公开(公告)号:CN119152862A
公开(公告)日:2024-12-17
申请号:CN202411604235.1
申请日:2024-11-12
Applicant: 浙江大学
IPC: G10L19/018 , G10L25/48 , G10L25/30
Abstract: 本发明公开了一种隐私保护的深度语音数字水印流式嵌入与检测方法,基于端云协同处理环境,有效隔离语音内容中的用户敏感信息与水印信息,同时实现流式嵌入、区间标注、防水印伪造、信道鲁棒等有益效果,支持语音内容版权声明、伪造样本标识等场景,服务第三方水印嵌入和检测应用,在整个水印嵌入阶段,服务器端仅根据水印信息生成通用水印数据,从而避免了用户隐私信息的泄露风险。在检测环节,接收端用户端采用第三深度神经网络对音频内容进行脱敏处理,使得服务器端仅能通过处理后的脱敏数据来推断水印的存在,隔绝了用户原始语音数据与服务器端的直接接触,显著提升了用户隐私保护水平,提高用户与第三方检测平台之间的信任感。
-
-
-
-