-
公开(公告)号:CN120045895A
公开(公告)日:2025-05-27
申请号:CN202510054300.6
申请日:2025-01-14
IPC: G06F18/21 , G06N3/082 , G06N3/096 , G06F18/213 , G06F18/24
Abstract: 本发明公开了面向深度神经网络剪枝技术的公平性优化及图像分类方法,涉及人工智能安全技术领域,其中公平性优化方法包括:获取训练数据集;通过训练数据集训练初始神经网络模型,获取神经网络模型;对神经网络模型进行剪枝;通过训练数据集和剪枝后的神经网络模型,获取不同敏感属性子组样本的几何度量,并对不同敏感属性子组样本的几何度量进行平均处理,计算极差公平性约束项,利用极差公平性约束项和分类损失项计算总体损失,通过总体损失对剪枝后的神经网络模型进行微调训练,获取目标剪枝模型。本发明能够在特征层面平衡组间性能,以解决现有研究无法在资源有限的终端设备中直接部署和快速与现有剪枝技术集成的不足。
-
公开(公告)号:CN117633478B
公开(公告)日:2024-06-18
申请号:CN202410023388.0
申请日:2024-01-08
IPC: G06F18/20 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/08 , G06Q50/00 , G06F16/9536 , G06F18/24
Abstract: 本发明公开了基于GNNs社交媒体挖掘的公平性后门评估方法及系统,包括:获取社交网络中的原始数据;根据长尾分布从所述原始数据中选择候选节点,构建候选空间;基于Wasserstein距离,遍历所述候选空间中的节点,生成公平触发器;基于所述公平触发器,构造后门数据;基于所述后门数据,选择不同的模型进行训练,并进行后门公平性评估。本发明采用一种新型的候选节点空间选择机制和动态自适应的后门触发器设计方法,以此动态生成后门数据,通过计算多种主流模型在不同任务场景下的公平性、准确性等指标,完成对社交媒体挖掘场景中图神经网络学习群体公平性后门的综合评估。
-
公开(公告)号:CN117250871A
公开(公告)日:2023-12-19
申请号:CN202311540413.4
申请日:2023-11-20
IPC: G05B13/04
Abstract: 本发明公开一种基于去中心化联邦学习的人机协作安全性评估方法和装置,包括:步骤S1、获取工业物联网环境中的雷达数据;步骤S2、根据雷达数据训练本地模型;步骤S3、各参与方通过对等网络与其邻居交换本地模型参数并聚合;步骤S4、基于聚合的本地模型构造扰动模型并通过协同策略对其优化;步骤S5、选择不同的协同策略优化扰动模型并进行人机协作安全性评估,以保障人机协作应用场景的安全性和可靠性。本发明技术方案,采用动态自适应的扰动模型构造机制和基于协同的扰动模型优化策略,从共识模型的收敛速度、准确性及多轮训练过程的稳定性等方面,完成对工业物联网场景中去中心化联邦学习鲁棒性的综合评估。
-
公开(公告)号:CN119988165A
公开(公告)日:2025-05-13
申请号:CN202510054322.2
申请日:2025-01-14
Abstract: 本发明公开了基于联邦学习系统的公平性和鲁棒性评估方法及装置,包括:中央服务器向客户端集合发布全局模型,正常客户端对全局模型进行训练,生成本地模型参数;测试客户端对全局模型进行扰动,构建扰动模型,通过双层投影机制对扰动模型进行优化,得到扰动模型参数;中央服务器对本地模型参数和扰动模型参数进行聚合,对本地模型参数进行聚合,得到第一全局模型和第二全局模型,进行若干通信轮次的模型发布、模型参数聚合过程,对单通信轮次或若干通信轮次后的第一全局模型和第二全局模型进行评价,得到公平性和鲁棒性评估结果。通过上述技术方案,本发明对联邦学习系统提供更有效的公平和鲁棒性能评估,保障全局模型在不同任务环境中的准确率。
-
公开(公告)号:CN119961728A
公开(公告)日:2025-05-09
申请号:CN202510054379.2
申请日:2025-01-14
Abstract: 本发明公开了一种针对中文大语言模型毒性和偏见的评估方法,包括:获取中文毒性语言数据集;采用中文毒性API进行判断毒性和偏见;确定评估模型的指标,其中,所述指标包括:毒性,偏见和回避率;利用所述中文毒性语言数据集对中文大语言模型进行毒性,偏见和回避程度的评估,从而获取评估结果。该方法提出了一个与测评数据集和模型无关通用评估框架TisEval,可应用于广泛的数据集和模型,该框架来评估大语言模型的毒性和偏见,是首个从毒性和偏见的角度对中文大语言模型进行了全面、系统的研究评估。
-
公开(公告)号:CN119961529A
公开(公告)日:2025-05-09
申请号:CN202510054695.X
申请日:2025-01-14
IPC: G06F16/9536 , G06F16/9535 , G06N5/04 , G06F18/22
Abstract: 本发明公开了一种针对大语言模型推荐系统场景的双边公平方法,涉及机器学习技术领域,包括:收集用户行为数据与项目数据;对用户行为数据与项目数据进行数据处理,分别生成用户的初步嵌入、项目的初步嵌入以及相似用户嵌入;利用大语言模型生成用户的增强嵌入和项目的增强嵌入;将初步嵌入、与增强嵌入进行融合,获得融合用户嵌入、融合项目嵌入;对融合用户嵌入和融合项目嵌入进行点积运算,获得推荐得分,引入交互次数惩罚因子对推荐得分进行处理,获得加权后的推荐得分;通过双边公平性优化策略对加权后的推荐得分进行处理,生成最终的推荐列表。本方法能够精准识别并调节不公平现象。
-
公开(公告)号:CN119988725A
公开(公告)日:2025-05-13
申请号:CN202510054729.5
申请日:2025-01-14
IPC: G06F16/9535 , G06F21/62 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及数据隐私保护与公平性增强技术领域,特别是涉及一种基于隐私保护与公平增强的信息推荐方法,包括:获取目标用户的行为数据;将所述行为数据输入预设的大规模推荐模型中,输出对于所述目标用户的推荐结果,其中,所述大规模推荐模型基于用户编码器和项目编码器构建,所述大规模推荐模型基于训练集训练获得,所述训练集包括若干用户和项目,在所述大规模推荐模型的训练过程中采用改进的差分隐私随机梯度下降方法进行模型参数的更新,并在训练过程中引入基于梯度的公平采样机制。本发明可以在保护数据隐私的基础上,解决大规模推荐模型的项目公平性问题,并且加速模型的训练过程,实现了模型效用以及公平之间的有效权衡。
-
-
公开(公告)号:CN117633478A
公开(公告)日:2024-03-01
申请号:CN202410023388.0
申请日:2024-01-08
IPC: G06F18/20 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/08 , G06Q50/00 , G06F16/9536 , G06F18/24
Abstract: 本发明公开了基于GNNs社交媒体挖掘的公平性后门评估方法及系统,包括:获取社交网络中的原始数据;根据长尾分布从所述原始数据中选择候选节点,构建候选空间;基于Wasserstein距离,遍历所述候选空间中的节点,生成公平触发器;基于所述公平触发器,构造后门数据;基于所述后门数据,选择不同的模型进行训练,并进行后门公平性评估。本发明采用一种新型的候选节点空间选择机制和动态自适应的后门触发器设计方法,以此动态生成后门数据,通过计算多种主流模型在不同任务场景下的公平性、准确性等指标,完成对社交媒体挖掘场景中图神经网络学习群体公平性后门的综合评估。
-
公开(公告)号:CN115631530B
公开(公告)日:2023-03-28
申请号:CN202211651570.8
申请日:2022-12-22
Applicant: 暨南大学
Abstract: 本发明公开一种基于人脸动作单元的公平人脸表情识别方法,包括:获取训练图片及人脸动作单元所在局部区域;构建平衡特征融合网络;对所述平衡特征融合网络添加权重分配,根据训练图片及人脸单元所在局部区域,通过联合损失函数对所述平衡特征融合网络进行优化,通过优化后的网络以实现公平人脸表情识别方法。
-
-
-
-
-
-
-
-
-