-
公开(公告)号:CN111352954A
公开(公告)日:2020-06-30
申请号:CN202010110929.5
申请日:2020-02-20
Applicant: 中国科学院自动化研究所
IPC: G06F16/2455 , G06F16/2458 , G06F16/28
Abstract: 本发明属于数据挖掘领域,具体涉及一种低资源条件下的关联规则挖掘方法、系统、装置,旨在解决现有的关联规则挖掘方法无法在低内存下完整的低频关联规则的挖掘的问题。本系统方法包括:获取待挖掘关联规则的数据集,对数据集各事务中的项进行数字化编码;获取高频频繁项集和高频关联规则;构建第一低频频繁项集和第二低频频繁项集;基于第一低频频繁项集、第二低频频繁项集,通过setdiff函数得到第三低频频繁项集,并根据第三低频频繁项集获取低频关联规则;输出高频关联规则、低频关联规则。本发明能够在低内存条件下挖掘完整的低频关联规则。
-
公开(公告)号:CN111352954B
公开(公告)日:2021-02-12
申请号:CN202010110929.5
申请日:2020-02-20
Applicant: 中国科学院自动化研究所
IPC: G06F16/2455 , G06F16/2458 , G06F16/28
Abstract: 本发明属于数据挖掘领域,具体涉及一种低资源条件下的关联规则挖掘方法、系统、装置,旨在解决现有的关联规则挖掘方法无法在低内存下完整的低频关联规则的挖掘的问题。本系统方法包括:获取待挖掘关联规则的数据集,对数据集各事务中的项进行数字化编码;获取高频频繁项集和高频关联规则;构建第一低频频繁项集和第二低频频繁项集;基于第一低频频繁项集、第二低频频繁项集,通过setdiff函数得到第三低频频繁项集,并根据第三低频频繁项集获取低频关联规则;输出高频关联规则、低频关联规则。本发明能够在低内存条件下挖掘完整的低频关联规则。
-