代码克隆检测方法、系统及计算机可读存储介质
摘要:
本发明涉及代码克隆检测方法、系统及计算机可读存储介质,代码克隆检测方法包括:S1、采集源码数据集,进行聚类分析,输出n类源码的类别标签以及标签特征;S2、对待检测代码依次进行处理,得到切分矩阵;S3、对切分矩阵分别与源码进行匹配,得到每个切分矩阵对应的目标源码类别标签;S4、对切分矩阵分别与其对应的目标源码类别标签下的所有源码片段矩阵遍历计算余弦相似度,并对每个切分矩阵加权计算每个源码对待检测代码的相似度得分并降序排列,保留得分topN对应的源码片段;S5、将源码片段及待检测代码输入LSTM‑DSSM网络模型计算相似度得分,输出相似度最高的源码片段。本发明能够有效检测是否存在源码克隆。
0/0