-
公开(公告)号:CN116302089B
公开(公告)日:2023-08-18
申请号:CN202310583348.7
申请日:2023-05-23
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于图片相似度的代码克隆检测方法、系统及存储介质,属于源代码克隆检测领域,包括:S1、构建源代码集的倒排索引字典;S2、计算待测目标文件的代码块哈希值,并以每个代码块的哈希值为键在所述倒排索引字典中搜索,得到对应的源代码的文件名列表;S3、计算待测目标文件与所述列表中每个源代码的代码块相似度K,若,则判断待测目标文件与对应的源代码不存在克隆关系;若,则判断待测目标文件与对应的源代码存在克隆关系;S4、提取对应的源代码以及待测目标文件的语义特征矩阵,并分别转换为对应的图片,分别计算待测目标文件与每个所述源代码对应的图片相似度,得到检测结果。本发明兼顾了大规模和语义克隆检测。
-
公开(公告)号:CN116521173A
公开(公告)日:2023-08-01
申请号:CN202310387165.8
申请日:2023-04-12
Applicant: 华中科技大学
IPC: G06F8/41 , G06F18/23213
Abstract: 本发明公开了一种代码依赖关系的检测方法、装置和系统,属于软件成分分析技术领域,所述检测方法包括:构建代码仓库‑版本‑函数对应的嵌套索引字典和代码仓库的索引字典;将嵌套索引字典中函数与代码仓库的索引字典对比并去重,再对去重后的嵌套索引字典中各函数进行复杂度过滤;对原嵌套索引字典中每个版本的函数调用图进行中心性过滤;将中心性过滤后的核心函数列表FL2和复杂度过滤后的函数信息列表FL1交集运算得到项目指纹函数;区别于现有技术中直接将待测函数与仓库内所有项目函数进行相似性比较,本发明将待测项目函数与项目指纹函数进行代码克隆检测得到待测项目函数的依赖关系,其计算复杂度更低且检测效率更高。
-
公开(公告)号:CN116302089A
公开(公告)日:2023-06-23
申请号:CN202310583348.7
申请日:2023-05-23
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于图片相似度的代码克隆检测方法、系统及存储介质,属于源代码克隆检测领域,包括:S1、构建源代码集的倒排索引字典;S2、计算待测目标文件的代码块哈希值,并以每个代码块的哈希值为键在所述倒排索引字典中搜索,得到对应的源代码的文件名列表;S3、计算待测目标文件与所述列表中每个源代码的代码块相似度K,若,则判断待测目标文件与对应的源代码不存在克隆关系;若,则判断待测目标文件与对应的源代码存在克隆关系;S4、提取对应的源代码以及待测目标文件的语义特征矩阵,并分别转换为对应的图片,分别计算待测目标文件与每个所述源代码对应的图片相似度,得到检测结果。本发明兼顾了大规模和语义克隆检测。
-
-