发明公开
- 专利标题: 一种提高目标模型的安全性的方法、电子设备及存储介质
-
申请号: CN202411402787.4申请日: 2024-10-09
-
公开(公告)号: CN118940299A公开(公告)日: 2024-11-12
- 发明人: 冯晓斌 , 谢文 , 王林 , 侯越先 , 徐楠 , 董立峰 , 罗引 , 王磊
- 申请人: 天津中科闻歌科技有限公司 , 北京中科闻歌科技股份有限公司
- 申请人地址: 天津市滨海新区天津自贸试验区(东疆综合保税区)延安道127号206-A008;
- 专利权人: 天津中科闻歌科技有限公司,北京中科闻歌科技股份有限公司
- 当前专利权人: 天津中科闻歌科技有限公司,北京中科闻歌科技股份有限公司
- 当前专利权人地址: 天津市滨海新区天津自贸试验区(东疆综合保税区)延安道127号206-A008;
- 代理机构: 北京锺维联合知识产权代理有限公司
- 代理商 张雯雯
- 主分类号: G06F21/60
- IPC分类号: G06F21/60 ; G06N20/00
摘要:
本发明提供了一种提高目标模型的安全性的方法、电子设备及存储介质,涉及模型技术领域,所述方法能够根据指定数据集的总集获取增量权重列表,进一步的获取第四类指令对应的模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,通过更新目标模型的权重来提高目标模型的安全性,可知本发明通过权重组合的方式获取模拟增量权重,根据模拟增量权重对目标模型的权重进行更新,提高目标模型的安全性的同时能够缓解目标模型针对第五类指令的过度防御,第五类指令为与第四类指令有相似的构建方式但不会指导目标模型违反其内部的安全策略并输出不良内容的指令,无需混合大量的通用指令数据,节省了算力时间消耗,对计算机设备的显存要求较低。