模型压缩方法、系统和计算设备

    公开(公告)号:CN112508194A

    公开(公告)日:2021-03-16

    申请号:CN202110142167.1

    申请日:2021-02-02

    Abstract: 本公开提供了模型压缩方法、系统和计算设备。该方法包括:通过至少一个计算设备:加载目标模型,所述目标模型包括多个特征嵌入向量;用训练数据集中至少部分数据训练所述目标模型,直至所述目标模型的损失函数收敛到预设范围内;以及执行模型压缩操作,所述模型压缩操作包括:基于所述训练,自主确定所述多个特征嵌入向量中的至少K个候选特征嵌入向量,所述K为自然数;从所述目标模型中删除所述至少K个候选特征嵌入向量,获得更新后的目标模型;以及用所述训练数据集中至少部分数据训练所述更新后的目标模型,直至所述更新后的目标模型的损失函数收敛到所述预设范围内。

    基于隐私保护的word2vec模型训练方法、装置及系统

    公开(公告)号:CN112507388A

    公开(公告)日:2021-03-16

    申请号:CN202110158847.2

    申请日:2021-02-05

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供用于经由至少两个第一成员设备训练word2vec模型的方法、装置及系统。各个第一成员设备基于所具有的本地语料的语料分词结果生成本地分词词库,使用各自的本地分词词库进行隐私求交确定公共分词,并向其余第一成员设备共享非公共分词数目。随后,各个第一成员设备根据公共分词以及各个第一成员设备的非公共分词数目进行统一分词编号,生成统一字典。然后,各个第一成员设备基于统一字典和本地语料的语料分词结果生成各自的训练样本,并使用各自的训练样本执行基于隐私保护的模型训练来训练出word2vec模型。

    一种业务规则自动生成方法和系统

    公开(公告)号:CN112365344A

    公开(公告)日:2021-02-12

    申请号:CN202110028140.X

    申请日:2021-01-11

    Inventor: 李龙飞 周俊

    Abstract: 本说明书实施例公开了一种业务规则自动生成方法和系统。所述方法包括:获取多个样本的业务数据,每个样本的业务数据包括该样本的标签数据和N个特征对应的特征数据,N为不小于2的整数;基于多个样本的特征数据进行因果图学习,得到一个或多个因果图,所述因果图包括两个以上存在因果关联的特征;对于一个或多个因果图中的任一个,利用多个样本的标签数据和在该因果图中的特征对应的特征数据训练树模型;基于训练出的树模型生成业务规则。

    保护神经网络模型安全的方法及装置

    公开(公告)号:CN112100628B

    公开(公告)日:2021-02-05

    申请号:CN202011280172.0

    申请日:2020-11-16

    Inventor: 王力 周俊

    Abstract: 本说明书实施例提供一种保护神经网络模型安全的方法,包括:获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;针对其中任意的第一网络层,在固定其他网络层参数的情况下,利用上述训练数据对该第一网络层进行第一调参,得到第一微调模型;确定该第一微调模型对应预设性能指标的第一指标值,该预设性能指标的指标值取决于对应模型,在测试数据上的测试损失和在上述训练数据上的训练损失之间的相对大小;同理,利用训练数据和测试数据对该第一网络层进行第二调参,得到第二微调模型,并确定第二指标值;基于第一指标值和第二指标值的相对大小,确定第一网络层对应的信息敏感度,在其大于预定阈值的情况下,对第一网络层进行安全处理。

    业务模型训练方法、装置及系统

    公开(公告)号:CN112288088A

    公开(公告)日:2021-01-29

    申请号:CN202011585759.2

    申请日:2020-12-29

    Inventor: 陈超超 周俊 王力

    Abstract: 本说明书实施例提供用于经由多个成员设备训练业务模型的方法、装置及系统。第一和第二成员设备分别具有第一和第二数据,第一和第二数据按照垂直切分方式组成用于模型训练的训练样本集,并且第一成员设备具有训练样本的标签数据。在每次循环时,各个成员设备协同,使用当前训练样本训练出当前业务模型并得到当前训练样本的模型预测结果。在第一成员设备处根据模型预测结果确定出当前训练样本中的预测误差最大的第一训练样本,并将第一训练样本的样本标识发送给各个第二成员设备。各个成员设备协同来从未使用训练样本中选择出与第一训练样本相似的第二训练样本,作为下一循环过程的当前训练样本。

    对抗样本的生成方法及装置

    公开(公告)号:CN112200257A

    公开(公告)日:2021-01-08

    申请号:CN202011112696.9

    申请日:2020-10-16

    Abstract: 本说明书实施例提供一种对抗样本的生成方法,所述对抗样本对应m维样本向量,用于攻击特定模型;该方法包括:确定m维空间的n维子空间所对应的m*n维投影矩阵,再基于该m*n维投影矩阵,对当前对抗样本进行多轮迭代更新,其中任一轮迭代更新包括:先从该n维子空间中随机采样b个高斯向量;接着,利用该m*n维投影矩阵,将所述b个高斯向量映射回该m维空间,得到b个干扰向量;再将所述b个干扰向量分别添加至当前对抗样本对应的样本向量,得到b个查询样本,并查询该所述b个查询样本是否对所述特定模型攻击成功;再基于b个干扰向量和对应的b个查询结果,估计样本梯度向量,并利用该样本梯度向量,更新上述当前对抗样本。

    一种隐私数据保护方法、系统及装置

    公开(公告)号:CN111324911B

    公开(公告)日:2021-01-01

    申请号:CN202010409778.3

    申请日:2020-05-15

    Inventor: 王力 周俊

    Abstract: 本说明书实施例公开了一种隐私数据保护方法、系统及装置。该方法包括:分别从至少两个数据源处获取隐私数据。对所述至少两个数据源的隐私数据执行第一处理操作,以获取至少两份第一处理数据,其中,所述第一处理操作用于对隐私数据的至少一部分进行隐匿。对第一处理数据执行第二处理操作,以获取第二处理数据,其中,所述第二处理操作用于将源自至少两个数据源的第一处理数据进行混合后划分为至少两个批次。依次传输所述第二处理数据中的至少两个批次至可信执行环境执行第三处理操作,其中,所述第三处理操作用于基于第二处理数据恢复出至少一份隐私数据中的至少一部分,并对所述至少一部分进行数据处理。

    保护神经网络模型安全的方法及装置

    公开(公告)号:CN112100628A

    公开(公告)日:2020-12-18

    申请号:CN202011280172.0

    申请日:2020-11-16

    Inventor: 王力 周俊

    Abstract: 本说明书实施例提供一种保护神经网络模型安全的方法,包括:获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;针对其中任意的第一网络层,在固定其他网络层参数的情况下,利用上述训练数据对该第一网络层进行第一调参,得到第一微调模型;确定该第一微调模型对应预设性能指标的第一指标值,该预设性能指标的指标值取决于对应模型,在测试数据上的测试损失和在上述训练数据上的训练损失之间的相对大小;同理,利用训练数据和测试数据对该第一网络层进行第二调参,得到第二微调模型,并确定第二指标值;基于第一指标值和第二指标值的相对大小,确定第一网络层对应的信息敏感度,在其大于预定阈值的情况下,对第一网络层进行安全处理。

    生物识别身份验证方法、客户端、服务器、设备及系统

    公开(公告)号:CN112084476A

    公开(公告)日:2020-12-15

    申请号:CN202010908350.3

    申请日:2020-09-02

    Abstract: 本说明书提供一种生物识别身份验证方法、客户端、服务器、设备及系统,可以利用服务器将生物识别模型进行拟合,获得生物识别函数,将生物识别函数以及生物特征发送至客户端,由客户端本地保存。当客户端接收到生物验证请求后,客户端可以利用本地存储的生物识别函数以及生物样本特征对用户进行身份验证。客户端在对用户进行身份验证时,不需要与服务器进行通信,直接利用本地存储的数据即可以进行,实现了离线状态下的生物识别身份验证,同时,将生物识别模型拟合成为生物识别函数,降低了计算的复杂度,提高了本地生物识别的速度。

Patent Agency Ranking