-
公开(公告)号:CN116954506A
公开(公告)日:2023-10-27
申请号:CN202310923867.3
申请日:2023-07-26
Applicant: 南京邮电大学
IPC: G06F3/06
Abstract: 一种大数据平台下小文件分块合并方法,首先定义用于启动合并文件模块的启动阈值,定义文件访问特征值并初始化;记录当前用户已经访问的文件数量,当用户访问文件时,将当前的访问特征值追加到文件的访问特征值序列;将文件缓存到Files集合中;当Files集合已满时文件访问特征值增1,并清空Files集合;划分区域块,通过文件的访问次数和存储位置,确定文件所处分块,根据文件的访问特征序列得到预测访问特征序列,进而进行预先的合并;进行第二次的合并操作;根据块与块之间文件特征值相同的数量定义为块与块之间的权重,利用最小完全子图对块进行合并;将合并后的文件保存到系统当中,并删除合并前的原小文件,从而实现基于用户访问行为的小文件分块合并。