基于Bi-LSTM和文本相似性的漏洞检测方法

    公开(公告)号:CN108763931A

    公开(公告)日:2018-11-06

    申请号:CN201810519622.3

    申请日:2018-05-28

    CPC classification number: G06F21/563 G06F21/577 G06N3/0454

    Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。

    具有隐私保护的表格类信息抽取系统及方法

    公开(公告)号:CN113221181B

    公开(公告)日:2022-08-09

    申请号:CN202110642036.X

    申请日:2021-06-09

    Abstract: 一种具有隐私保护的表格类信息抽取系统及方法,包括:位于本地端的节点单元特征收集模块、用户隐私敏感脱敏模块和神经网络采集模块以及位于云服务端的图神经网络模块,节点单元特征收集模块根据用户输入待识别的图片,通过部署在本地端的文字识别模型和文字定位模型识别出节点得到节点的文字段以及坐标特征,用户隐私敏感脱敏模块利用自注意力机制,通过坐标空间转换文字空间转换将每个节点的文字、坐标信息进行变换并得到原语义在不同维度下的向量,神经网络采集模块将待识别图像通过卷积神经网络的卷积操作提取出图像特征,图神经网络模块根据节点连接关系节点特征,使用图卷积神经网络理解学习节点的位置特征以及邻接关系,最终得到节点连接关系,通过节点单元特征收集模块得到的节点文字、坐标信息以及云服务端返回的节点连接关系,提取出整个图片信息并恢复出整个表格。

    基于Bi-LSTM和文本相似性的漏洞检测方法

    公开(公告)号:CN108763931B

    公开(公告)日:2021-11-16

    申请号:CN201810519622.3

    申请日:2018-05-28

    Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。

    具有隐私保护的表格类信息抽取系统及方法

    公开(公告)号:CN113221181A

    公开(公告)日:2021-08-06

    申请号:CN202110642036.X

    申请日:2021-06-09

    Abstract: 一种具有隐私保护的表格类信息抽取系统及方法,包括:位于本地端的结点单元特征收集模块和用户隐私敏感脱敏模块以及位于云端的神经网络采集模块和图神经网络模块,结点单元特征收集模块根据用户输入待识别的图片,通过部署在本地端的文字识别模型和文字定位模型识别出结点得到结点的文字段以及坐标特征,保护用户隐私安全模块利用自注意力机制,通过坐标空间转换文字空间转换将每个结点的文字、坐标信息进行变换并得到原语义在不同维度下的向量,神经网络采集模块将待识别图像通过卷积神经网络的卷积操作提取出图像特征,图神经网络模块根据结点连接关系结点特征,使用图卷积神经网络理解学习结点的位置特征以及邻接关系,最终得到结点连接关系,通过结点单元特征收集模块得到的结点文字、坐标信息以及云服务端返回的结点间的连接依赖关系,提取出整个图片信息并恢复出整个表格。

Patent Agency Ranking