一种基于向量数据库的特征融合代码克隆检测方法及装置

    公开(公告)号:CN117591172A

    公开(公告)日:2024-02-23

    申请号:CN202311546640.8

    申请日:2023-11-20

    IPC分类号: G06F8/75 G06F16/33 G06F16/31

    摘要: 本发明公开了一种基于向量数据库的特征融合代码克隆检测方法及装置,能够对代码的函数级别进行解析,得到融合了词法、语法和特征信息的代码指纹,并采用了向量数据库进行存储和查找,大大加快了对于相似代码的查询和检测;随后根据查询到的相似代码函数进行阈值筛选和基于token的最长公共子序列计算得到细粒度的相似度结果,并根据细粒度的相似结果作为函数级别的代码相似结果;最后,根据函数级别的代码相似结果反推出文件级别的相似度结果,通过文件级别的相似度结果反推出项目级别的相似度结果。本发明可以实现在海量数据(亿级别及以上)的情况下快速筛选出最为相似的代码克隆结果,既能保证检测速度,又能保证细粒度情况下检测结果的准确性。

    一种面向JS制品包的函数级指纹构建方法

    公开(公告)号:CN117591166A

    公开(公告)日:2024-02-23

    申请号:CN202311546614.5

    申请日:2023-11-20

    IPC分类号: G06F8/70 G06F8/71 G06F8/75

    摘要: 本发明公开了一种面向JS制品包的函数级指纹构建方法,包括以下步骤:(1)构建开源三方库制品包:将JS项目源文件通过全自动构建工具生成制品包,该构建工具基于预设规则自行调整配置参数以提高构建成功率;(2)基于AST语法树对生成的制品包代码进行函数级切片,以识别和分离各个函数;(3)分析函数级AST节点的语法结构,提取函数代码的特征信息;(4)通过局部敏感哈希计算提取的特征信息,得到代码指纹。本发明通过结合全自动打包工具、AST语法解析,创新性地实现构建JS制品包中的函数级指纹,有助于进一步进行JS制品包的成分识别,解决代码中的安全性和可靠性问题。

    容器资源调整方法、装置及系统
    3.
    发明公开

    公开(公告)号:CN117251252A

    公开(公告)日:2023-12-19

    申请号:CN202311302020.X

    申请日:2023-10-07

    IPC分类号: G06F9/455 G06F9/50

    摘要: 本申请提供容器资源调整方法、装置及系统,其中所述容器资源调整方法包括:接收目标业务请求,其中,所述目标业务请求包括目标业务标识;在资源配置库中存在所述目标业务标识对应的目标容器组标识的情况下,确定所述目标容器组标识对应的容器资源配置信息;根据所述容器资源配置信息运行所述目标容器组标识对应的目标容器组;获取所述目标容器组的资源使用信息和容器运行结果;基于预设容器资源调整策略、所述资源使用信息和所述容器运行结果,调整所述目标容器组的容器资源配置信息。实现了目标容器组在不同业务场景下的容器资源配置信息调整,避免因资源不足导致容器运行失败,以及因容器资源过于充足,导致的资源浪费。