基于分布估计的金融敏感数据共享方法及系统

    公开(公告)号:CN117852667A

    公开(公告)日:2024-04-09

    申请号:CN202311700992.4

    申请日:2023-12-12

    申请人: 之江实验室

    发明人: 江波 邓秋良 杨耀

    摘要: 本发明公开了一种基于分布估计的金融敏感数据共享方法及系统。金融机构拥有丰富且敏感的数据,如果可以在不泄漏客户隐私的前提下进行共享应用,预期会提升金融机构的数据建模和分析的效果。本发明方法基于分布估计,在对金融客户的各属性信息进行脱敏的同时,能够保证脱敏前后的数据统计分布一致。本发明探索了屏蔽自编码器(Masked Autoencoder)在金融敏感数据分布估计上的应用,在保护用户隐私的前提下,各金融机构可以安全地共享数据,提升数据建模和分析的能力。

    一种图像识别的安全防御方法、装置和计算机设备

    公开(公告)号:CN117058493B

    公开(公告)日:2024-02-13

    申请号:CN202311326470.2

    申请日:2023-10-13

    申请人: 之江实验室

    摘要: 本申请涉及一种图像识别的安全防御方法、装置和计算机设备。所述方法包括:在原图像识别模型的原始样本集中加入与原图像识别模型的梯度相反的噪音,得到模型训练集;随机抽取预设数量的模型训练集中的图像数据,分别输入到各个子专家网络模型中,得到数据特征;计算此组图像数据的准确率交叉熵损失函数、差异性损失函数和焦点稳定性损失函数;基于此组图像数据的准确率交叉熵损失函数、差异性损失函数和焦点稳定性损失函数,利用梯度下降法对多专家网络模型的参数进行更新;当多专家网络模型收敛时,得到用于图像识别的完备多专家网络模型。采用本方法能够解决现有技术中存在人工智能模型对于黑客攻击的防御效果差问题。

    基于注意力机制的个性化联邦学习泛化方法、设备、应用

    公开(公告)号:CN117010484B

    公开(公告)日:2024-01-26

    申请号:CN202311277193.0

    申请日:2023-10-07

    申请人: 之江实验室

    发明人: 张璐 杨耀

    摘要: 本发明涉及一种基于注意力机制的个性化联邦学习泛化方法、设备、应用,包括:初始化全局模型的共享参数并发送给预先建立连接的一个客户端,接收各个客户端经过本地训练后的共享参数以及个性化参数,基于各个客户端的共享参数更新服务端的共享参数;将已有客户端的个性化参数以及服务端的共享参数发送到未经训练的新客户端,在新客户端利用基于注意力机制的超网络生成个性化参数。新客户端采用本地数据进行训练以更新超网络参数,而非本地模型参数。即共享参数部分不变,通过超网络学习生成新客户端的个性化参数。本发明在构造新客户端的超网络时,超网络同时参考各个模型的个性化参数,以引入客户端个性化参数的相关性信息,提升最终效果。

    基于联合树模型的数据预测方法、装置和计算机设备

    公开(公告)号:CN116821817A

    公开(公告)日:2023-09-29

    申请号:CN202310595002.9

    申请日:2023-05-23

    申请人: 之江实验室

    摘要: 本申请涉及一种基于联合树模型的数据预测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:首先,获取本地数据集与初始第三方数据集,之后,基于所述本地数据集确定局部训练树模型,基于联合数据集确定局部联合树模型,其中,所述联合数据集包括所述本地数据集和初始第三方数据集,之后,基于所述本地数据集确定所述局部训练树模型和局部联合树模型的树节点的信息熵值,之后,基于所述信息熵值确定所述初始第三方数据集参与训练的增益程度,基于所述增益程度确定目标第三方数据集,并基于所述本地数据集以及目标第三方数据集确定目标联合树模型,最后,将待预测数据输入所述目标联合树模型,得到预测结果。

    数据异常值处理方法、装置、计算机设备和可读存储介质

    公开(公告)号:CN116756494A

    公开(公告)日:2023-09-15

    申请号:CN202311057175.1

    申请日:2023-08-22

    申请人: 之江实验室

    摘要: 本申请涉及一种数据异常值处理方法、装置、计算机设备和可读存储介质。所述方法包括:获取多个单样本数据中的目标列数据以及多个特征列数据;基于多个所述单样本数据的历史数据,确定每个所述单样本数据的异常值处理次数;根据所述目标列数据对多个所述特征列数据进行分类,得到多个特征列数据组;基于异常值处理次数为多个所述特征列数据组分配对应的数据组处理次数;基于所述数据组处理次数,对相应特征列数据组中的特征列数据进行异常数据处理。采用本方法能够实现数据的预处理,且为特征列数据组分配恰当的异常值处理次数,确保良好的数据清洗效果的同时尽可能的减少数据处理时间和资源的浪费,大幅度提高数据异常值处理的效率和精度。

    基于统计结构化本地差分隐私的理财产品推荐方法及系统

    公开(公告)号:CN116188171A

    公开(公告)日:2023-05-30

    申请号:CN202211648515.3

    申请日:2022-12-19

    申请人: 之江实验室

    摘要: 本发明公开一种基于统计结构化本地差分隐私的理财产品推荐方法及系统。包括:在用户端获取原始特征,原始特征根据取值类型分为连续值特征和离散分类特征,并按取值类型对原始特征进行预处理,分析确定特征筛选标准,再对预处理后的原始特征进行筛选;对筛选后的特征进行分群处理得到若干样本分群,对不同的样本分群添加对应的结构化差分噪声;构建理财产品推荐模型,将添加结构化差分噪声后的样本集划分为训练集与测试集,利用训练集训练推荐模型,将测试集输入训练好的推荐模型进行推理,得到推荐因子。本发明方法考虑离散分类特征,基于统计结构化的本地差分隐私方法,定量化隐私预算,保护理财用户隐私的基础上,提高推荐因子的计算准确度。

    基于强化学习的投资组合确定方法、装置和电子设备

    公开(公告)号:CN116029835A

    公开(公告)日:2023-04-28

    申请号:CN202310095700.2

    申请日:2023-01-18

    申请人: 之江实验室

    摘要: 本申请涉及一种基于强化学习的投资组合确定方法、装置和电子设备,其中,该基于强化学习的投资组合确定方法包括:构建包括多种不同投资策略的投资策略库,投资策略用于确定投资组合;构建用于表征交易窗口状态的状态特征向量,状态特征向量包括样本状态特征向量和真实状态特征向量;根据投资策略库和样本状态特征向量训练神经网络模型,得到投资组合决策模型;根据真实状态特征向量和投资组合决策模型确定目标投资策略,根据目标投资策略确定目标投资组合。通过选取多种针对不同市场状态的投资策略构建投资策略库,相比于现有技术,决策结果更加稳定,且更具有解释性。解决了相关技术中存在决策结果不稳定、可解释性差的问题。

    一种基于知识迁移和自监督学习的纵向联邦金融风控方法

    公开(公告)号:CN117853212B

    公开(公告)日:2024-06-18

    申请号:CN202410255763.4

    申请日:2024-03-06

    申请人: 之江实验室

    摘要: 本发明公开了一种基于知识迁移和自监督学习的纵向联邦金融风控方法及装置,所述方法首先分别在金融机构和各互联网电商各自本地数据集上进行预训练,其中对有标签的金融机构,进行有监督学习,得到本地预训练模型表示层和推理层,对无标签的互联网电商,进行自监督学习,得到本地预训练模型表示层;然后在重叠数据集上建立纵向联邦风控模型,并利用预训练阶段的本地预训练模型,辅助纵向联邦模型训练,提升纵向联邦模型性能。本发明通过纵向联邦学习,在保护各方数据安全和数据隐私的前提下,实现了用户特征维度的扩展;通过知识迁移和自监督学习,实现了非重叠数据的利用,大大提高了纵向联邦金融风控模型的预测准确度。

    基于车险场景的风险识别方法和装置

    公开(公告)号:CN117273963B

    公开(公告)日:2024-06-07

    申请号:CN202311550781.7

    申请日:2023-11-21

    申请人: 之江实验室

    摘要: 本申请涉及一种基于车险场景的风险识别方法和装置。所述方法包括:对获取到的车险场景预测数据集进行预处理,得到待预测特征;将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。采用本方法能够解决人工手段识别车险场景的风险效率低,准确性差的问题,实现对车险场景下风险案件的快速预测和对疑点的准确迅速定位。