-
公开(公告)号:CN118246029A
公开(公告)日:2024-06-25
申请号:CN202410451915.8
申请日:2024-04-16
Applicant: 重庆大学
IPC: G06F21/57 , G06F8/75 , G06F11/36 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/045
Abstract: 本发明涉及一种基于代码数据流增强大模型的漏洞检测方法,适用于任意代码预训练模型的漏洞检测下游任务。该方法主要由数据流图构建、数据流嵌入和正弦位置嵌入、合并数据流信息三个步骤组成。步骤一从函数粒度的源代码中解析数据流图并使用变量数据类型的词嵌入作为节点特征。步骤二通过图学习技术进行数据流图嵌入,通过正弦位置编码将数据流中的相对位置信息合并到图嵌入中,以保证漏洞数据流信息的完整性。步骤三将步骤二中产生的数据流嵌入与预训练模型产生的源代码句向量拼接,使用多层感知机进行漏洞检测。本发明能够通过与代码预训练模型相结合来增强漏洞检测方法在处理复杂数据流信息方面的能力,从而提高检测的性能和效率。
-
公开(公告)号:CN118245382A
公开(公告)日:2024-06-25
申请号:CN202410452033.3
申请日:2024-04-16
Applicant: 重庆大学
IPC: G06F11/36 , G06F18/2415 , G06F18/22 , G06N3/044
Abstract: 本发明涉及一种面向深度神经网络模型的测试用例选择方法,属于计算机软件测试技术领域,该发明的核心思想是,度量循环神经网络对每个测试用例的置信度与测试用例之间的相似程度,选择出具有代表性的低置信度测试用例。该发明主要由状态向量空间构建、不确定性与相似性度量和测试优先级排序三个步骤组成。1)对于给定的测试集输入,提取循环神经网络在每个时间步下输出的概率向量。2)在此向量空间内度量模型对每条测试用例的不确定性和模型状态改变的相似性。3)根据不确定性对测试用例集排序,根据相似性决定测试用例的去留。本发明适用于从大规模未标记的数据集中筛选出易引发循环神经网络错误行为的数据子集,以降低数据标注的成本。
-