-
公开(公告)号:CN112433756B
公开(公告)日:2021-09-07
申请号:CN202011329523.2
申请日:2020-11-24
Applicant: 北京京航计算通讯研究所
IPC: G06F8/75 , G06F16/901 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明涉及一种基于加权递归自编码器的快速代码克隆检测方法及装置,属于代码克隆技术领域,解决了现有的代码克隆技术检测精度较差且效率较低的问题。方法包括:获取待检测代码数据集,对待检测代码数据集进行预处理,得到待检测代码数据集中每一代码对应的二叉树;基于二叉树和加权递归自编码器获得待检测代码数据集中每一代码对应的最终向量,并基于每一代码对应的最终向量得到最终向量集合;基于最终向量集合构建导航展开图,并根据导航展开图对最终向量集合中的任意两个最终向量进行检测,得到代码克隆对。实现了代码克隆对的快速检测,提高了检测效率和精度。
-
公开(公告)号:CN112433756A
公开(公告)日:2021-03-02
申请号:CN202011329523.2
申请日:2020-11-24
Applicant: 北京京航计算通讯研究所
IPC: G06F8/75 , G06F16/901 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明涉及一种基于加权递归自编码器的快速代码克隆检测方法及装置,属于代码克隆技术领域,解决了现有的代码克隆技术检测精度较差且效率较低的问题。方法包括:获取待检测代码数据集,对待检测代码数据集进行预处理,得到待检测代码数据集中每一代码对应的二叉树;基于二叉树和加权递归自编码器获得待检测代码数据集中每一代码对应的最终向量,并基于每一代码对应的最终向量得到最终向量集合;基于最终向量集合构建导航展开图,并根据导航展开图对最终向量集合中的任意两个最终向量进行检测,得到代码克隆对。实现了代码克隆对的快速检测,提高了检测效率和精度。
-