-
公开(公告)号:CN108763931A
公开(公告)日:2018-11-06
申请号:CN201810519622.3
申请日:2018-05-28
Applicant: 上海交通大学
CPC classification number: G06F21/563 , G06F21/577 , G06N3/0454
Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。
-
公开(公告)号:CN114491548A
公开(公告)日:2022-05-13
申请号:CN202111612183.9
申请日:2021-12-27
Applicant: 上海交通大学
Abstract: 一种基于中间语言与迁移表征学习的漏洞挖掘系统及,包括:迁移表征模型训练模块、卷积网络训练模块和软件漏洞挖掘模块,迁移表征模型训练模块使用编译成中间语言并预处理后的数据与标签对双向长短期记忆网络进行迁移学习训练,并将BiLSTM网络中的中间隐藏层计算结果输出,作为数据集的高级表征形式;卷积网络训练模块使用数据的高级表征形式与对应标签,训练一个卷积神经网络分类器用于对高级表征进行判别;软件漏洞挖掘模块使用另外两个模块训练生成的模型,首先对未知的软件进行编译和预处理,并将处理后的代码段输入BiLSTM网络中,从BiLSTM网络的隐藏层中得到数据高级表征,再输入卷积神经网络分类器中,最终得到该代码段是否具有漏洞判别结果。
-
公开(公告)号:CN108763931B
公开(公告)日:2021-11-16
申请号:CN201810519622.3
申请日:2018-05-28
Applicant: 上海交通大学
Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。
-
公开(公告)号:CN114491548B
公开(公告)日:2025-03-18
申请号:CN202111612183.9
申请日:2021-12-27
Applicant: 上海交通大学
IPC: G06F21/57 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/096 , G06F8/41
Abstract: 一种基于中间语言与迁移表征学习的漏洞挖掘系统及,包括:迁移表征模型训练模块、卷积网络训练模块和软件漏洞挖掘模块,迁移表征模型训练模块使用编译成中间语言并预处理后的数据与标签对双向长短期记忆网络进行迁移学习训练,并将BiLSTM网络中的中间隐藏层计算结果输出,作为数据集的高级表征形式;卷积网络训练模块使用数据的高级表征形式与对应标签,训练一个卷积神经网络分类器用于对高级表征进行判别;软件漏洞挖掘模块使用另外两个模块训练生成的模型,首先对未知的软件进行编译和预处理,并将处理后的代码段输入BiLSTM网络中,从BiLSTM网络的隐藏层中得到数据高级表征,再输入卷积神经网络分类器中,最终得到该代码段是否具有漏洞判别结果。
-
-
-