-
公开(公告)号:CN106407296B
公开(公告)日:2019-06-25
申请号:CN201610764220.0
申请日:2016-08-30
Applicant: 中通服咨询设计研究院有限公司
IPC: G06F16/2458
Abstract: 本发明公开了基于预判筛选的局部扫描关联规则计算机数据分析方法,本发明针对经典Apriori算法的固有缺陷,基于预判筛选的关联规则分析算法,提出一种基于事务号查询的局部扫描关联规则分析算法‑MAWP算法,该算法对包含频繁k项集的事务号进行记录,然后在连接、剪枝、预判筛选的基础上,在对筛选后的候选k项集进行验证的过程中,不是对数据库中所有事务进行全部扫描,而是进行局部扫描,仅扫描包含某k‑1项集并且事务数最少的事务集合,从而减少确定频繁项目集所扫描的事务总数,降低算法运算的时间,提高算法的运算效率。
-
公开(公告)号:CN105320756B
公开(公告)日:2018-07-10
申请号:CN201510666724.4
申请日:2015-10-15
Applicant: 中通服咨询设计研究院有限公司
IPC: G06F17/30
Abstract: 本发明提出了一种基于改进Apriori算法的数据库关联规则挖掘方法。本方法将事务数据库转化为关系矩阵,转化后的关系矩阵为稀疏矩阵,并使用正交链表存储关系矩阵。频繁项目集的产生过程转化为对应关系矩阵中项目所对应单链表节点集合的运算过程。本方法只需扫描数据库一遍,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点,减少了频繁进行I/O操作的时间;其次,生成和发现频繁2‑项集时只需要进行节点集合的交运算,耗费时间较少,并且对生成的频繁k‑项集构造单链表进行记录,简化了频繁k+1项集的生成过程,避免了Apriori算法复杂的剪枝过程。
-
公开(公告)号:CN105260387B
公开(公告)日:2018-06-29
申请号:CN201510575640.X
申请日:2015-09-10
Applicant: 中通服咨询设计研究院有限公司
IPC: G06F17/30
Abstract: 本发明针对经典Apriori算法的固有缺陷,提出了一种面向海量事务数据库的关联规则分析方法,包括在连接、剪枝的基础上,添加了预判的步骤,使用先验概率对候选频繁K项集集合CK进行缩减优化,并且引入阻尼因子Δ1和补偿因子Δ2对使用先验概率产生的误差进行修正,若候选K项集集合CK中成员ci的先验概率P(ci)>(1+Δ1)min_support,则将该成员直接添加到频繁k‑项集LK中;若P(ci)
-
-