基于Bi-LSTM和文本相似性的漏洞检测方法

    公开(公告)号:CN108763931B

    公开(公告)日:2021-11-16

    申请号:CN201810519622.3

    申请日:2018-05-28

    Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。

    基于Bi-LSTM和文本相似性的漏洞检测方法

    公开(公告)号:CN108763931A

    公开(公告)日:2018-11-06

    申请号:CN201810519622.3

    申请日:2018-05-28

    CPC classification number: G06F21/563 G06F21/577 G06N3/0454

    Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。

Patent Agency Ranking