识别重复文件的方法及电子设备
摘要:
本申请适用于终端技术领域,提供了一种识别重复文件的方法及电子设备。识别重复文件的方法包括:对存储空间中的文件进行扫描;将扫描到的文件中文件大小相等的文件划分至同一组,得到一个或多个第一文件组;剔除包括单个文件的第一文件组,并计算剩余的第一文件组中各个文件的首尾页散列值,将同一个第一文件组中首尾页散列值相等的文件划分至同一组,得到一个或多个第二文件组;剔除包括单个文件的第二文件组,并计算剩余的第二文件组中每个文件的文件散列值;基于剩余的第二文件组中各个文件的文件散列值,识别剩余的第二文件组中的重复文件。本方案能够减少终端设备识别重复文件时的计算量,提高终端设备的重复文件识别速度。
公开/授权文献
0/0