一种快速挖掘超市数据稀有项集的方法

    公开(公告)号:CN108427734A

    公开(公告)日:2018-08-21

    申请号:CN201810164497.9

    申请日:2018-02-27

    Abstract: 本发明提出一种快速挖掘超市数据稀有项集的方法,属于信息挖掘和分析技术领域。本发明包括以下步骤:步骤1、利用原始数据集生成垂直数据集;步骤2、将垂直数据集按单个项的支持度划分为频繁垂直数据集和稀有垂直数据集;步骤3、根据稀有垂直数据集得到稀有1-项集,在原始数据集中删除掉不包含稀有1-项的事务,得到包含稀有1-项的原始数据集;步骤4、通过迭代对包含稀有1-项的原始数据集进行稀有k-项集的挖掘,k≥2;步骤5、将所有挖掘到的稀有项集存储到稀有垂直数据中。本发明采用垂直数据集的思想,通过划分垂直数据集为频繁垂直数据集和稀有垂直数据集以达到降低数据扫描的规模,再通过存储已得稀有项集及其支持度进而减少候选项集的数量。

Patent Agency Ranking