-
公开(公告)号:CN119204158A
公开(公告)日:2024-12-27
申请号:CN202411240294.5
申请日:2024-09-05
Applicant: 北京信息科技大学
IPC: G06N3/094 , G06N3/0475 , G06N3/096 , G06N3/045
Abstract: 本发明公开了一种基于对抗样本迁移的黑盒大语言模型测试方法,涉及语言模型测试技术领域。包括:S1、获取原始样本以及源白盒LLM;S2、基于原始样本对源白盒LLM进行分析,得到用于测试具有相似功能的目标黑盒LLM的对抗样本;S3、对源白盒LLM进行注意力分析来确定原始样本中的重要元素;S4、对重要元素添加扰动,得到能有效触发错误的对抗样本;S5、基于S4中得到的对抗样本,进行迁移测试,并输出LLM的鲁棒性测试结果。本发明同时综合多个模型的内部输出信息提高对抗样本的泛化性,从而用于黑盒LLM模型的测试。相比于黑盒测试,无需对目标模型进行任何额外的查询,适用于目标模型查询受限的应用场景。
-
公开(公告)号:CN115879499A
公开(公告)日:2023-03-31
申请号:CN202211648195.1
申请日:2022-12-21
Applicant: 北京信息科技大学
IPC: G06N3/04
Abstract: 本发明公开了一种基于可解释性分析的DNN模型差分测试方法及系统,涉及缺陷模型检测技术领域,具体步骤为:步骤1、将待测模型集中每个DNN模型对测试用例集的预测行为,使用可解释性方法分析每个DNN模型行为,输出模型行为解释集;步骤2、基于模型行为解释集利用差异分析方法检测存在缺陷的DNN模型。本发明可提高检测缺陷模型的能力和时间效率,且可在单个模型之间比较行为差异,无需多次训练待测模型。
-
公开(公告)号:CN109992507B
公开(公告)日:2022-06-24
申请号:CN201910220776.7
申请日:2019-03-22
Applicant: 北京信息科技大学 , 中国科学院信息工程研究所
IPC: G06F11/36
Abstract: 本发明实施例提供的基于模拟执行的程序模糊测试方法及装置,所述方法包括:获取当前测试用例,利用所述当前测试用例对待测试程序进行模糊测试,获得测试结果,判断所述测试结果是否满足测试结束条件,获得第一判断结果;若所述第一判断结果为否,则对当前测试用例进行测试用例更改操作,获得新测试用例,根据所述新测试用例和预存的约束条件集进行程序模拟,获得模拟结果,判断所述模拟结果是否满足约束条件,获得第二判断结果;若所述第二判断结果为是,则利用所述新测试用例对待测试程序进行模糊测试,获得新测试结果,并在所述新测试结果满足测试结束条件时,输出测试报告。实现减少反复执行程序次数,降低花销提高运行效率的目的。
-
公开(公告)号:CN109977030B
公开(公告)日:2022-04-19
申请号:CN201910343573.7
申请日:2019-04-26
Applicant: 北京信息科技大学
IPC: G06F11/36
Abstract: 本发明实施例提供一种深度随机森林程序的测试方法及设备,该方法包括根据一代测试用例集获取一代三级覆盖率信息,一代三级覆盖率信息包括第一多粒度扫描完全覆盖率信息、第一级联森林任一类型覆盖率信息和第一级联森林全类型测试覆盖率信息;若一代三级覆盖率信息不符合预设测试要求,则对一代测试用例集的测试用例三级覆盖率进行排序处理,得到排序结果,根据排序结果得到父代交叉算子信息;对父代交叉算子信息进行交叉变异操作,以更新一代测试用例集,直至符合预设测试要求。通过测试覆盖率计算标准,得到三级覆盖率信息,且整个测试流程可以在达到预设测试要求时自动停止,降低了测试的成本。
-
公开(公告)号:CN108804308B
公开(公告)日:2021-10-01
申请号:CN201810391348.6
申请日:2018-04-27
Applicant: 北京信息科技大学
Abstract: 本发明实施例提供的一种新版本程序缺陷检测方法及装置,所述方法包括:获取目标应用的历史版本程序和新版本程序;根据所述历史版本程序和所述新版本程序获得对应的函数调用语句集;根据所述函数调用语句集获得所述历史版本程序和所述新版本程序分别对应的关联规则集;根据所述关联规则集获得用于所述新版本程序的检测用关联规则集;根据所述检测用关联规则集和所述新版本程序的函数调用语句集获得疑似缺陷集,能有效过滤隐式编程规则,从而减少待确认缺陷,提高缺陷自动检测效率。
-
公开(公告)号:CN119476271A
公开(公告)日:2025-02-18
申请号:CN202411547174.X
申请日:2024-11-01
Applicant: 北京信息科技大学
IPC: G06F40/258 , G06F40/30 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种基于对抗学习的issue标题生成模型鲁棒性提升方法,涉及对抗学习技术领域。包括将原始训练集中的issue原始样本输入到大语言模型中,使用思维链提示方法,利用大语言模型生成可能诱导现有issue标题生成模型产生错误标题或低质量标题的对抗样本,重复生成过程得到issue对抗训练集,运用数据增强策略,将issue对抗训练集与原始训练集混合生成混合训练集,使用混合训练集对现有issue标题生成模型进行重新训练,获得鲁棒模型,将样本输入鲁棒模型,获得生成的issue标题。本发明能够有效地模拟模型在真实应用场景中可能面临的复杂情况和输入变化,显著提升模型的鲁棒性。
-
公开(公告)号:CN115033490B
公开(公告)日:2024-08-30
申请号:CN202210746493.8
申请日:2022-06-29
Applicant: 北京信息科技大学
IPC: G06F11/36
Abstract: 本发明公开了一种控件层次关系图制导的Android应用错误复现方法,应用于软件测试技术领域,首先,使用被测应用项目文件生成APK文件,分析APK文件获取函数调用,结合函数调用和被测应用项目文件分析得到界面跳转和控件与函数间的关联关系,完成控件层次关系图的构建;其次,定位可疑控件,并使用控件层次关系图和可疑控件计算控件适应度;最后,识别被测应用当前界面中的控件信息,使用控件适应度计算出每个控件被选择的概率,根据概率选择控件进行操作,并检测应用运行状态。本方法关注于错误报告中涉及到的可疑控件,减少对非必要路径的探索,提高复现效率。
-
公开(公告)号:CN117350367A
公开(公告)日:2024-01-05
申请号:CN202311470614.1
申请日:2023-11-07
Applicant: 北京信息科技大学
IPC: G06N3/096 , G06N3/0464
Abstract: 本发明公开了一种基于解释分析的深度神经网络模型迁移测试方法,涉及模型迁移测试技术领域,包括以下步骤:S1:模型行为解释分析;S2:通用测试数据生成;S3:迭代扰动。本发明有效分析测试数据中不同元素的贡献程度,并根据贡献程度选择不同元素进行变异,使生成的测试数据能有效测试与被分析模型功能类似结构未知的其他DNN模型;首次使用解释方法对DNN模型行为进行解释,并以此制导DNN模型的测试数据生成;使用迭代优化的方式迭代分析测试数据中的重要元素并对其添加扰动以生成更有效的测试数据;将通过分析白盒源模型的内部信息来生成可迁移测试目标黑盒模型的测试数据。
-
公开(公告)号:CN116108450A
公开(公告)日:2023-05-12
申请号:CN202310174564.6
申请日:2023-02-28
Applicant: 北京信息科技大学
Abstract: 本发明公开了基于操作码指令聚类的智能合约漏洞检测方法及系统,涉及智能合约技术领域,将智能合约的EVM字节码转换为操作码指令,通过词嵌入模型将操作码指令特征向量化;对向量化后的操作码指令进行聚类;选择有漏洞的合约进行切片组建漏洞库,根据聚类结果将漏洞库的合约中属于同一簇的操作码指令统一替换;将待检测合约进行切片,利用聚类结果将待检测合约中属于同一簇的操作码指令统一替换,通过与漏洞库中合约比较相似度来检测漏洞。本发明提供的基于操作码指令聚类的智能合约漏洞检测方法及系统解决了由于编译器版本不同造成编译生成的操作码指令差异,导致难以检测不同版本编译器生成的操作码指令中同类漏洞以及漏洞检测时间开销大的问题。
-
公开(公告)号:CN109766259A
公开(公告)日:2019-05-17
申请号:CN201811464880.2
申请日:2018-12-03
Applicant: 北京信息科技大学
IPC: G06F11/36
Abstract: 本发明实施例提供一种基于复合蜕变关系的分类器测试方法及系统。其中,方法包括:将分类器的多个一元蜕变关系复合为复合蜕变关系;基于所述复合蜕变关系,生成测试用例;基于所述复合蜕变关系和所述测试用例,对所述分类器进行测试,并获取测试结果。本发明实施例提供的方法及系统,通过将分类器的多个一元蜕变关系复合为复合蜕变关系,然后基于复合蜕变关系对分类器进行测试,并获取测试结果。可降低测试成本、提高测试效率。既能有效利用分类器本身所具有的元方法不确定性和计算目的不确定性等特征,还能明显提升分类器的测试效果。有效利用分类器本身所具有的特征、显著提高分类器的测试效率、提高蜕变关系的检错能力、降低测试成本。
-
-
-
-
-
-
-
-
-