发明公开
- 专利标题: 基于最大频繁模式的动态规则库构建方法
- 专利标题(英): Dynamic rule base construction method based on maximum frequent patterns
-
申请号: CN201810092166.9申请日: 2018-01-30
-
公开(公告)号: CN108173876A公开(公告)日: 2018-06-15
- 发明人: 肖如良 , 陈雄 , 蔡声镇 , 熊金波 , 倪友聪 , 龚平 , 许力
- 申请人: 福建师范大学
- 申请人地址: 福建省福州市闽侯县上街镇大学城科技路1号,福建师范大学旗山校区
- 专利权人: 福建师范大学
- 当前专利权人: 福建师范大学
- 当前专利权人地址: 福建省福州市闽侯县上街镇大学城科技路1号,福建师范大学旗山校区
- 代理机构: 福州元创专利商标代理有限公司
- 代理商 蔡学俊
- 主分类号: H04L29/06
- IPC分类号: H04L29/06
摘要:
本发明涉及一种基于最大频繁模式的动态规则库构建方法,包括以下步骤:输入Web日志数据集,并对其进行数据过滤,将时间格式转化为时间戳,将IP和URL映射为数字;进行用户识别和会话识别,构造WASD;遍历WASD的每行,过滤出每个用户的近期访问行为,构成该用户的近期访问序列,进而由所有用户的近期访问序列构成DWASD;构造Spark运行环境变量sc;计算min_support;对前缀进行权重计数,并提取频繁1项集;遍历频繁1项集,递归寻找频繁项集;计算最大频繁项集,得到基于最大频繁模式的动态规则库。该方法有利于降低计算量,快速有效地构建出更加具有时效性的规则库。
公开/授权文献
- CN108173876B 基于最大频繁模式的动态规则库构建方法 公开/授权日:2020-11-06