基于差分隐私机制的大模型训练方法、介质及系统

    公开(公告)号:CN119494408A

    公开(公告)日:2025-02-21

    申请号:CN202510066183.5

    申请日:2025-01-16

    Abstract: 本发明公开了一种基于差分隐私机制的大模型训练方法、介质和系统,其中方法包括:S101,获取历史数据,并进行预处理,以及对预处理后的历史数据进行分组和标注,以形成训练数据集;S102,初始化大语言模型参数;S103,基于训练数据集进行训练,并计算梯度;S104,进行梯度加噪,以得到加噪梯度,并基于加噪梯度计算对应的综合不公平性指标值;S105,判断综合不公平性指标值是否处于预设取值范围内;S106,如果综合不公平指标值处于预设取值范围内,则判断当前大语言模型是否满足训练要求;如果是,则将当前大语言模型作为最终模型;如果否,则返回步骤S103。能够实现对用户隐私进行有效保护,同时,避免因使用差分隐私机制而导致的不公平现象的产生。

Patent Agency Ranking