- 专利标题: 代码克隆检测方法、系统及计算机可读存储介质
-
申请号: CN202310457759.1申请日: 2023-04-26
-
公开(公告)号: CN116166321B公开(公告)日: 2023-06-27
- 发明人: 陈晓莉 , 国毓芯 , 朱崇 , 赵祥廷 , 林建洪
- 申请人: 浙江鹏信信息科技股份有限公司
- 申请人地址: 浙江省杭州市余杭区仓前街道向往街1008号14幢9-10层
- 专利权人: 浙江鹏信信息科技股份有限公司
- 当前专利权人: 浙江鹏信信息科技股份有限公司
- 当前专利权人地址: 浙江省杭州市余杭区仓前街道向往街1008号14幢9-10层
- 代理机构: 浙江永鼎律师事务所
- 代理商 王日精
- 主分类号: G06F8/75
- IPC分类号: G06F8/75 ; G06F18/23 ; G06F18/214 ; G06N3/08 ; G06N3/0442
摘要:
本发明涉及代码克隆检测方法、系统及计算机可读存储介质,代码克隆检测方法包括:S1、采集源码数据集,进行聚类分析,输出n类源码的类别标签以及标签特征;S2、对待检测代码依次进行处理,得到切分矩阵;S3、对切分矩阵分别与源码进行匹配,得到每个切分矩阵对应的目标源码类别标签;S4、对切分矩阵分别与其对应的目标源码类别标签下的所有源码片段矩阵遍历计算余弦相似度,并对每个切分矩阵加权计算每个源码对待检测代码的相似度得分并降序排列,保留得分topN对应的源码片段;S5、将源码片段及待检测代码输入LSTM‑DSSM网络模型计算相似度得分,输出相似度最高的源码片段。本发明能够有效检测是否存在源码克隆。
公开/授权文献
- CN116166321A 代码克隆检测方法、系统及计算机可读存储介质 公开/授权日:2023-05-26