一种基于少量公共数据的隐私模型训练方法及装置

    公开(公告)号:CN112199717A

    公开(公告)日:2021-01-08

    申请号:CN202011065611.6

    申请日:2020-09-30

    Abstract: 本发明提供一种基于少量公共数据的隐私模型训练方法及电子装置,包括:使用若干训练得到N个神经网络教师模型;将少量的公共数据xi分别输入N个神经网络教师模型,得到各公共数据xi对各标签k的统计投票结果;对各统计投票结果添加噪声,获取满足差分隐私原理的公共数据xi及相应标签;通过大量的随机噪声向量与一预训练判别神经网络,优化对抗生成网络,并生成大量无标注数据;通过满足差分隐私原理的公共数据xi及相应标签、大量无标注数据对预训练的自编码器联合训练学生模型,得到隐私学生模型。本发明只需少量公共数据即可训练一个隐私学生模型,实现对敏感数据的物理隔离和网络隔离,解决了隐私学生模型的精确度不高这一问题。

    一种多方参与数据不共享的网络模型训练方法

    公开(公告)号:CN112163238A

    公开(公告)日:2021-01-01

    申请号:CN202010940180.7

    申请日:2020-09-09

    Abstract: 本发明公开了一种多方参与数据不共享的网络模型训练方法,其步骤包括:1)参与数据共享的各参与方利用所选隐私数据集训练各自所选网络模型,分别得到一教师网络模型;2)采用步骤a)~b)对学生网络模型S进行多轮训练,得到最终的公开网络模型M;a)选出一个教师网络模型Ti指导学生网络模型S更新:首先将训练数据Xi输入模型Ti,得到标签 在中加入噪声N得到Yi,将Xi输入学生网络模型S,输出S(Xi);然后最小化S(Xi)与Yi之间的相似距离训练学生网络模型S;b)利用学生网络模型S对公开的未标记数据进行部分标记,然后使用部分标注的数据通过半监督知识蒸馏的方法将学生网络模型S中的知识蒸馏到一公开网络模型M中。

    一种基于少量公共数据的隐私模型训练方法及装置

    公开(公告)号:CN112199717B

    公开(公告)日:2024-03-22

    申请号:CN202011065611.6

    申请日:2020-09-30

    Abstract: 本发明提供一种基于少量公共数据的隐私模型训练方法及电子装置,包括:使用若干训练得到N个神经网络教师模型;将少量的公共数据xi分别输入N个神经网络教师模型,得到各公共数据xi对各标签k的统计投票结果;对各统计投票结果添加噪声,获取满足差分隐私原理的公共数据xi及相应标签;通过大量的随机噪声向量与一预训练判别神经网络,优化对抗生成网络,并生成大量无标注数据;通过满足差分隐私原理的公共数据xi及相应标签、大量无标注数据对预训练的自编码器联合训练学生模型,得到隐私学生模型。本发明只需少量公共数据即可训练一个隐私学生模型,实现对敏感数据的物理隔离和网络隔离,解决了隐私学生模型的精确度不高这一问题。

    一种多方参与数据不共享的网络模型训练方法

    公开(公告)号:CN112163238B

    公开(公告)日:2022-08-16

    申请号:CN202010940180.7

    申请日:2020-09-09

    Abstract: 本发明公开了一种多方参与数据不共享的网络模型训练方法,其步骤包括:1)参与数据共享的各参与方利用所选隐私数据集训练各自所选网络模型,分别得到一教师网络模型;2)采用步骤a)~b)对学生网络模型S进行多轮训练,得到最终的公开网络模型M;a)选出一个教师网络模型Ti指导学生网络模型S更新:首先将训练数据Xi输入模型Ti,得到标签在中加入噪声N得到Yi,将Xi输入学生网络模型S,输出S(Xi);然后最小化S(Xi)与Yi之间的相似距离训练学生网络模型S;b)利用学生网络模型S对公开的未标记数据进行部分标记,然后使用部分标注的数据通过半监督知识蒸馏的方法将学生网络模型S中的知识蒸馏到一公开网络模型M中。

Patent Agency Ranking