-
公开(公告)号:CN117236420B
公开(公告)日:2024-03-26
申请号:CN202311509786.5
申请日:2023-11-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/098 , G06F18/2113 , G06F18/214 , G06F18/2433 , G06F18/27 , G06F21/60 , G06F21/62 , G06Q40/03 , H04L9/08
Abstract: 本发明公开了一种基于数据子集的纵向联邦学习异常数据调试方法及系统,包括:发起方基于纵向联邦学习建模并进行联邦模型训练;利用训练后的联邦模型获取数据集中的问题数据子集,问题数据子集在联邦模型中的预测准确率低于其他数据子集在联邦模型中的预测准确率;对问题数据子集进行基于特征描述组合的筛选,获取带有异常描述的问题数据子集;发起方或参与方基于带有异常描述的问题数据子集进行数据溯源和纠正,并在纠正后重新训练联邦模型。本发明为隐私保护的联邦数据子集评估技术,在保证数据隐私下对联邦数据子集评估指标进行正确计算,形成基于数据子集的联邦学习调试方法,自动化定位异常数据,解决联邦学习模型表现异常的问题。
-
公开(公告)号:CN115017184B
公开(公告)日:2022-11-08
申请号:CN202210952830.9
申请日:2022-08-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/242 , G06F16/2458 , G06F16/28 , G06F21/62
Abstract: 本发明实施例公开了一种数据查询方法。通过获取安全查询工作台输入的安全查询SQL语句;解析所述安全查询SQL语句,以获取数据参与方ID以及各个数据参与方的任务调度信息,并将各个数据参与方的任务调度信息分别分发至相应的数据参与方;接收各个数据参与方反馈的加密中间计算结果,并聚合为安全分析结果显示于所述安全查询工作台,不仅避免了多方数据持有方的原始数据泄露以及被二次分发的风险,还实现了对多方数据持有方的数据进行深度挖掘的效果。
-
公开(公告)号:CN117236420A
公开(公告)日:2023-12-15
申请号:CN202311509786.5
申请日:2023-11-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/098 , G06F18/2113 , G06F18/214 , G06F18/2433 , G06F18/27 , G06F21/60 , G06F21/62 , G06Q40/03 , H04L9/08
Abstract: 本发明公开了一种基于数据子集的纵向联邦学习异常数据调试方法及系统,包括:发起方基于纵向联邦学习建模并进行联邦模型训练;利用训练后的联邦模型获取数据集中的问题数据子集,问题数据子集在联邦模型中的预测准确率低于其他数据子集在联邦模型中的预测准确率;对问题数据子集进行基于特征描述组合的筛选,获取带有异常描述的问题数据子集;发起方或参与方基于带有异常描述的问题数据子集进行数据溯源和纠正,并在纠正后重新训练联邦模型。本发明为隐私保护的联邦数据子集评估技术,在保证数据隐私下对联邦数据子集评估指标进行正确计算,形成基于数据子集的联邦学习调试方法,自动化定位异常数据,解决联邦学习模型表现异常的问题。
-
公开(公告)号:CN115017184A
公开(公告)日:2022-09-06
申请号:CN202210952830.9
申请日:2022-08-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/242 , G06F16/2458 , G06F16/28 , G06F21/62
Abstract: 本发明实施例公开了一种数据查询方法。通过获取安全查询工作台输入的安全查询SQL语句;解析所述安全查询SQL语句,以获取数据参与方ID以及各个数据参与方的任务调度信息,并将各个数据参与方的任务调度信息分别分发至相应的数据参与方;接收各个数据参与方反馈的加密中间计算结果,并聚合为安全分析结果显示于所述安全查询工作台,不仅避免了多方数据持有方的原始数据泄露以及被二次分发的风险,还实现了对多方数据持有方的数据进行深度挖掘的效果。
-
-
-