一种基于串行集成学习的定向漏洞挖掘方法及系统

    公开(公告)号:CN115510455A

    公开(公告)日:2022-12-23

    申请号:CN202211251160.4

    申请日:2022-10-13

    Abstract: 本发明公开了一种基于串行集成学习的定向漏洞挖掘方法及系统,对代码训练集进行标签化后形成带有标签的训练集,抽取其中漏洞代码训练集做数据预处理,对预处理后的漏洞代码做敏感函数定位,得到包含敏感函数的语句;利用程序控制流图CFG获取与该语句相关的程序切片,基于漏洞训练集代码的数量,利用无敏感语句的代码训练集与其混合形成均匀的训练集模块;将赋予初始权重的训练集样本送入到CART决策树的弱分类器中进行训练,通过计算得到分类误差率和迭代次数是否满足要求来调整权重系数并重新学习,按照加权集成的方式形成最终强分类器,实现测试样本分类,完成漏洞挖掘。本方法考虑了代码的上下文依赖关系,降低了传统漏洞挖掘的误报率和漏报率。

    一种基于深度学习的定向漏洞挖掘方法

    公开(公告)号:CN115357896A

    公开(公告)日:2022-11-18

    申请号:CN202210799713.3

    申请日:2022-07-08

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度学习的定向漏洞挖掘方法,通过将训练集源代码做数据预处理,形成CWE二分类和CWE多分类两个模块,获取上述漏洞代码的敏感函数,并进行标签化处理;再利用joern生成CPG代码切片并进行向量化处理,对其分别使用离线深度学习和在线图启发式学习;利用验证集,按照上述数据处理方式生成二分类和多分类评估报告;再将待测源代码通过上述模型生成判定的漏洞类型并输出结果,用判定的漏洞程序进行关键点覆盖子图的生成,并用QEMU动态插桩模块,实现判定漏洞程序的动态分析结果,并形成最终的定向漏洞挖掘报告,具有良好的完整性、准确性和实用性。

    基于并行集成学习的漏洞挖掘方法、装置、设备及介质

    公开(公告)号:CN115130110A

    公开(公告)日:2022-09-30

    申请号:CN202210797374.5

    申请日:2022-07-08

    Abstract: 本发明公开了一种基于并行集成学习的漏洞挖掘方法,涉及计算机网络安全技术领域,用于解决现有高漏报率和误报率较高的问题,该方法包括以下步骤:接收混合均匀的漏洞代码训练集;对所述训练集进行随机采样;对每个随机采样的样本进行分词,并对分词后的句子进行向量化,得到特征向量;将所述特征向量输入至增量式并行集成学习的多个基模型中进行训练;对各个基模型输出的分类结果进行投票,得到漏洞分类结果。本发明还公开了一种基于并行集成学习的漏洞挖掘装置、电子设备和计算机存储介质。本发明通过对提取的特征向量进行并行集成学习分类,进而获取准确的漏洞分类结果,避免了样本分布不均和重复挖掘的问题,且准确率高。

Patent Agency Ranking