一种面向容器仓库中加密镜像的文件去重方法和装置

    公开(公告)号:CN118171298A

    公开(公告)日:2024-06-11

    申请号:CN202410375303.5

    申请日:2024-03-29

    Applicant: 浙江大学

    Abstract: 一种面向容器仓库中加密镜像的文件去重方法和装置,其方法包括:(1)将Docker镜像数据部分解压,在LZ77编码空间训练语义哈希模型(2)基于DBSCAN聚类算法以及局部敏感哈希算法,将具有相似哈希码的数据块划分为一个簇,使用每一个簇中心数据的哈希码作为这个簇的加密密钥。(3)存储Docker镜像时,将部分解压的数据划分为块并输入语义哈希模型,计算数据块的哈希码,并将数据块分配到相似簇中以获得密钥。(4)使用FASTCDC算法对数据块进行划分,使用密钥对划分后的子数据块进行加密,对加密后的子数据块进行去重处理,记录元数据信息后进行存储。本发明通过引入语义哈希技术,以及基于LZ77编码的数据相似空间,能够高效、准确地为相似数据块生成相同密钥,从而在加密数据场景下提高镜像仓库的数据去重率以及运行时吞吐量。

Patent Agency Ranking