-
公开(公告)号:CN108763931A
公开(公告)日:2018-11-06
申请号:CN201810519622.3
申请日:2018-05-28
Applicant: 上海交通大学
CPC classification number: G06F21/563 , G06F21/577 , G06N3/0454
Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。
-
公开(公告)号:CN113221181B
公开(公告)日:2022-08-09
申请号:CN202110642036.X
申请日:2021-06-09
Applicant: 上海交通大学
Abstract: 一种具有隐私保护的表格类信息抽取系统及方法,包括:位于本地端的节点单元特征收集模块、用户隐私敏感脱敏模块和神经网络采集模块以及位于云服务端的图神经网络模块,节点单元特征收集模块根据用户输入待识别的图片,通过部署在本地端的文字识别模型和文字定位模型识别出节点得到节点的文字段以及坐标特征,用户隐私敏感脱敏模块利用自注意力机制,通过坐标空间转换文字空间转换将每个节点的文字、坐标信息进行变换并得到原语义在不同维度下的向量,神经网络采集模块将待识别图像通过卷积神经网络的卷积操作提取出图像特征,图神经网络模块根据节点连接关系节点特征,使用图卷积神经网络理解学习节点的位置特征以及邻接关系,最终得到节点连接关系,通过节点单元特征收集模块得到的节点文字、坐标信息以及云服务端返回的节点连接关系,提取出整个图片信息并恢复出整个表格。
-
公开(公告)号:CN113570469A
公开(公告)日:2021-10-29
申请号:CN202110851738.9
申请日:2021-07-27
Applicant: 上海交通大学 , 中国太平洋保险(集团)股份有限公司
Abstract: 一种面向车险用户的智能化换车预测系统及方法,该系统包括:数据处理模块、离线训练模块以及在线预测模块,数据处理模块根据用户车险保单信息,进行数据筛选和数据标注处理并输出用户是否换车及更换车型结果,离线训练模块根据用户车险保单及标注信息,进行机器学习模型训练并输出预测模型,在线预测模块根据新的用户保单信息及预测模型,进行用户是否换车以及更换指定车型预测,输出用户是否换车以及是否更换指定车型。本发明根据历史用户车险保单数据中前后年份保单中投保车辆是否一致来标注用户是否换车以及所更换的车型,筛选用户相关特征集以训练机器学习以及深度学习模型,完成用户是否换车以及是否更换指定车型的精准预测。
-
公开(公告)号:CN113570469B
公开(公告)日:2024-05-28
申请号:CN202110851738.9
申请日:2021-07-27
Applicant: 上海交通大学 , 中国太平洋保险(集团)股份有限公司
IPC: G06Q40/08 , G06Q30/0201 , G06Q10/04 , G06N20/00 , G06N3/0464 , G06F18/214 , G06F16/9535
Abstract: 一种面向车险用户的智能化换车预测系统及方法,该系统包括:数据处理模块、离线训练模块以及在线预测模块,数据处理模块根据用户车险保单信息,进行数据筛选和数据标注处理并输出用户是否换车及更换车型结果,离线训练模块根据用户车险保单及标注信息,进行机器学习模型训练并输出预测模型,在线预测模块根据新的用户保单信息及预测模型,进行用户是否换车以及更换指定车型预测,输出用户是否换车以及是否更换指定车型。本发明根据历史用户车险保单数据中前后年份保单中投保车辆是否一致来标注用户是否换车以及所更换的车型,筛选用户相关特征集以训练机器学习以及深度学习模型,完成用户是否换车以及是否更换指定车型的精准预测。
-
公开(公告)号:CN108763931B
公开(公告)日:2021-11-16
申请号:CN201810519622.3
申请日:2018-05-28
Applicant: 上海交通大学
Abstract: 一种基于Bi‑LSTM和文本相似性的漏洞检测方法,通过敏感函数对文本文件切片得到代码段,对代码段通过分词算法处理得到单词从而生成用于组成文本向量的字典,通过字典将文本转化为词向量字典作为训练样本对Bi‑LSTM模型进行训练,从而得到漏洞的文本性特征以及模型参数,通过最终得到的LSTM模型进行待测源码的漏洞判断。本发明基于静态分析的深度学习挖掘漏洞方法,不需要进行复杂的环境配置和代码编译,直接对源代码进行分析并可根据现有代码进行更新模型,相较于传统方式不需要软件工程师进行修改,能够提高检测速度,并将已有的自然语言处理(NLP)的方式应用到漏洞挖掘中,通过相似性查找漏洞。
-
公开(公告)号:CN113221181A
公开(公告)日:2021-08-06
申请号:CN202110642036.X
申请日:2021-06-09
Applicant: 上海交通大学
Abstract: 一种具有隐私保护的表格类信息抽取系统及方法,包括:位于本地端的结点单元特征收集模块和用户隐私敏感脱敏模块以及位于云端的神经网络采集模块和图神经网络模块,结点单元特征收集模块根据用户输入待识别的图片,通过部署在本地端的文字识别模型和文字定位模型识别出结点得到结点的文字段以及坐标特征,保护用户隐私安全模块利用自注意力机制,通过坐标空间转换文字空间转换将每个结点的文字、坐标信息进行变换并得到原语义在不同维度下的向量,神经网络采集模块将待识别图像通过卷积神经网络的卷积操作提取出图像特征,图神经网络模块根据结点连接关系结点特征,使用图卷积神经网络理解学习结点的位置特征以及邻接关系,最终得到结点连接关系,通过结点单元特征收集模块得到的结点文字、坐标信息以及云服务端返回的结点间的连接依赖关系,提取出整个图片信息并恢复出整个表格。
-
-
-
-
-