一种基于数据离散度无关性的数据立方体构建方法
摘要:
本发明提供了一种基于数据离散度无关性的数据立方体构建方法,包括针对第一元组,利用其中的N个不同属性产生2N个子集,将所述2N个子集以及每个子集对应的元组标识符放入Hash表中;针对第二元组,利用其中的N个不同属性产生2N个子集;将第二元组所产生的2N个子集和Hash表中已有的子集进行对比;若第二元组所产生的某个子集和Hash表中已有的某个子集一致,则将该子集所对应的元组标识符添加到Hash表中与该子集对应的元组标识符一列中;否则将该子集以及该子集对应的元组标识符放入Hash表中。本发明解决了在数据离散度高的条件下,现有Frag-Shells算法效率大大降低的问题。
0/0