-
公开(公告)号:CN119938492A
公开(公告)日:2025-05-06
申请号:CN202411861567.8
申请日:2024-12-17
IPC: G06F11/362 , G06F11/3668 , G06N20/00
Abstract: 本申请提供一种AI代码缺陷修复数据集构建方法、缺陷修复方法及设备。数据集构建方法,包括:获取多组初始AI代码数据;每组初始AI代码数据分别包括缺陷数据和对应的修复数据;对多组初始AI代码数据进行变异处理;每组变异AI代码数据包括变异缺陷数据和对应的变异修复数据;对多组初始AI代码数据和多组变异AI代码数据分别进行去重和上下文提取处理,得到多组AI代码片段;依据CWE标准对多组AI代码片段进行分类和标注,得到多组结构化的AI代码片段;对多组结构化的AI代码片段进行预处理,以使多组结构化的AI代码数据对应的数据格式一致;将预处理后的每组结构化的AI代码片段,分别生成思维链数据,得到AI代码数据集。
-
公开(公告)号:CN115688915A
公开(公告)日:2023-02-03
申请号:CN202211085668.1
申请日:2022-09-06
Applicant: 北京邮电大学
IPC: G06N3/094 , G06F16/35 , G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本申请提供的一种对抗样本生成方法、装置、电子设备及存储介质,包括:获取样本数据,将样本数据作为初始数据,基于语义分类器计算初始数据中的每个单词的重要性得分,基于重要性得分对单词进行排序;利用基于转换器的双向编码表征算法计算每个单词的同义词集合及每个同义词的语义得分;基于排序顺序选取一个单词为待替换单词,基于待替换单词的同义词集合及每个同义词的语义得分,计算待替换单词的每个同义词的攻击性得分;选取攻击性得分最高的同义词,在初始数据中替换待替换单词,生成待测试数据;判断待测试数据能否完成对样本数据的攻击行为,若是,则将待测试数据作为样本数据的对抗样本。
-
公开(公告)号:CN119940570A
公开(公告)日:2025-05-06
申请号:CN202411870164.X
申请日:2024-12-18
Applicant: 北京邮电大学
Abstract: 本申请一个或多个实施例提供一种卫星节点资源异构下的联邦学习模型安全压缩方法及相关设备。所述方法包括:基于稀疏矩阵压缩算法对联邦学习模型压缩,得到所述联邦学习模型的第一压缩参数,每个所述第一压缩参数对应一个索引值;分别对所述第一压缩参数和所述索引值压缩和加密;其中,所述第一压缩参数基于拟合算法压缩,并基于同态加密算法加密。通过本申请可以在保证模型的安全性的条件下,提高模型通信效率。
-
公开(公告)号:CN119886329A
公开(公告)日:2025-04-25
申请号:CN202411830845.3
申请日:2024-12-12
Applicant: 北京邮电大学
Abstract: 本申请提供一种联邦学习的推理增强方法、装置、电子设备及存储介质,该方法包括推理客户端获取目标任务数据的目标特征,将所述目标特征加密后,发送给各个非推理客户端;然后确定所述目标特征与所述推理客户端包括的各个数据类别的数据的第二距离,以及确定各个数据类别对应的第二数据量,基于所述第一目标距离、所述第二距离、所述第一数据量及所述第二数据量确定所述目标任务数据的推理增强结果,通过与各个非推理客户端包括的各个类别的数据进行距离匹配,发挥了全局数据资源的优势,同时降低了客户端密文匹配时的计算代价,实现对全局异构数据的有效利用,提高了联邦学习推理增强的效率和准确度。
-
公开(公告)号:CN119990306A
公开(公告)日:2025-05-13
申请号:CN202411892485.X
申请日:2024-12-20
Abstract: 本公开提供一种数据异构联邦学习模型推理方法及相关装置,包括:确定待推理数据,基于待推理数据进行特征提取,得到第一特征图,对第一特征图进行加密,得到第一加密特征图,并传输至至少一个第二客户端,以使至少一个第二客户端生成第一加密查询距离,接收至少一个第二客户端发送的至少一个第一加密查询距离,并构建查询数据点集合,对第一加密查询距离进行解密,得到至少一个解密查询距离,基于至少一个解密查询距离对查询数据点集合进行选取,得到至少一个近邻数据点,对至少一个近邻数据点进行置信度计算,得到推理结果。本公开构建隐私保护的特征图查询机制,在保护数据特征隐私的前提下增强模型推理能力,降低全局模型重新训练的需求。
-
公开(公告)号:CN119940475A
公开(公告)日:2025-05-06
申请号:CN202411851758.6
申请日:2024-12-16
IPC: G06N3/098 , G06N3/096 , G06N5/04 , G06V10/82 , G06V10/764
Abstract: 一种利用高阶子模型辅助训练的联邦学习方法及装置,该方法通过集成多高阶子模型的决策信息,增强低阶子模型的推理准确率;低阶子模型可以借助高阶子模型的决策信息和基于特征距离的最高阶子模型的量化矩阵辅助训练,提高训练效果;通过降低目标类别置信度的目标损失(信息熵)优化低阶子模型,避免了传统自蒸馏中再次拟合高阶子模型的目标类别置信度引起的信息偏移问题;利用对比学习统一各级子模型的特征维度,构建基于特征距离的最高阶子模型的量化矩阵作为监督信息,通过最小化低阶子模型与最高阶子模型距离矩阵的分布差异,引导低阶子模型接近最高阶子模型的量化矩阵,指导低阶子模型挖掘不同图像中的语义关系,提高模型的泛化能力。
-
公开(公告)号:CN115329836A
公开(公告)日:2022-11-11
申请号:CN202210777660.5
申请日:2022-07-04
Applicant: 北京邮电大学
IPC: G06K9/62 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种硬标签黑盒场景下自然对抗文本生成方法及装置,该方法通过获取数据集中的离散文本X,通过重要单词鉴别器识别所述离散文本X中的重要单词,根据重要单词鉴别器的重要单词识别结果生成重要单词集合I;采用掩语言模型对重要单词集合I的每个重要单词生成候选单词集合,对重要单词集合I中的指定重要单词采用对应的候选单词集合中的词进行替换,以生成初始化的对抗文本X*;最终利用遗传算法对生成的对抗样本X*迭代的进行变异、选择及交叉操作,得到具有指定语义相似度的优化的对抗样本Xadv。本申请攻击成功率高,具有较好的流畅性和语法正确性。
-
公开(公告)号:CN113343951A
公开(公告)日:2021-09-03
申请号:CN202110894201.0
申请日:2021-08-05
Applicant: 北京邮电大学
Abstract: 本公开提供一种人脸识别对抗样本生成方法和对应的人脸识别方法以及相关设备,基于人脸图像的预设区域的关键特征,设计系统化对抗样本生成方法,使用空白图像替代人脸图像上的预设区域,并且将所生成的预设区域对抗图像应用于图形变换后的人脸图像上,由此所获得的对抗图像,能够在实际的网络攻击应用中为网络安全测试提供准确的数据依据,提高了网络安全测试的工作效率,且整个方法实际应用便捷,实现成本低,并能够快速实施,准确获得对抗图像。
-
-
-
-
-
-
-