一种关联聚类数据瘦身方法及系统
摘要:
本发明公开了一种关联聚类数据瘦身方法,基于预生成的树形结构,对所述树形结构中的根关联类节点的缓存表进行初始化,选择符合预设瘦身条件的数据填入所述根节点缓存表中;从根节点开始,按照广度优先遍历依次对树形结构中的每个关联类节点进行瘦身操作;得到所述树形结构中所有目标表对应的瘦身结果文件。本发明实施例提供的关联聚类数据瘦身方法,数据表按照业务特征进行聚类为树形结构,用以抽象数据特征,根据关联键对数据进行关联瘦身,可以在完整保留原数据业务逻辑关系的情况下对数据完成瘦身。
公开/授权文献
0/0