一种网络日志挖掘中的Web建模方法及系统

    公开(公告)号:CN102254004A

    公开(公告)日:2011-11-23

    申请号:CN201110197622.4

    申请日:2011-07-14

    Abstract: 本发明公开了一种网络日志挖掘中的Web建模方法及系统,达到提高网站服务质量的目的。该方法包括:对网络日志进行预处理,获得可信网络日志;根据用户的访问兴趣以及该可信网络日志,进行特征网页选取和网址分段,基于加权随机索引的方法建立用户浏览访问模式矩阵;使用基于混沌蚁群优化的聚类算法对该用户访问模式矩阵进行优化聚类,并根据预设的类别标签标记用户所属的类别,建立用户公共档案;根据该用户公共档案以及预设的预取概率阈值,将预取概率超过预设的预取概率阈值的页面提取并保存到服务器的缓存中。本发明与现有预取技术相比,准确率有了大幅度的提高。

    一种网络日志挖掘中的用户聚类方法及系统

    公开(公告)号:CN102158365A

    公开(公告)日:2011-08-17

    申请号:CN201110131511.3

    申请日:2011-05-20

    Abstract: 本发明公开了一种网络日志挖掘中的用户聚类方法及系统,达到提高网站服务质量的目的。该方法包括:对网络日志进行预处理,获得可信网络日志;根据用户的访问兴趣以及该可信网络日志,建立表达用户是否访问了特征网页的用户访问模式矩阵;使用基于菌群优化的聚类算法对该用户访问模式矩阵进行优化聚类,并根据预设的类别数目标签标记用户所属的类别,建立用户公共档案;根据该用户公共档案,将预取概率超过预设的预取概率阈值的页面提取并保存到缓存中。本发明与现有预取技术相比,准确率有了大幅度的提高。

    一种网页预取方法和系统

    公开(公告)号:CN102222098A

    公开(公告)日:2011-10-19

    申请号:CN201110165459.3

    申请日:2011-06-20

    Abstract: 本发明公开了一种基于混沌蚁群优化聚类的网页预取方法和系统,达到提高网站服务质量的目的。该方法包括:对网络日志进行预处理,获得可信网络日志;根据用户的访问兴趣以及该可信网络日志,建立表达用户是否访问了特征网页的用户访问模式矩阵;使用基于混沌蚁群优化的聚类算法对该用户访问模式矩阵进行优化聚类,并根据预设的类别数目标签标记用户所属的类别,建立用户公共档案;根据该用户公共档案,将预取概率超过预设的预取概率阈值的页面提取并保存到缓存中。本发明与现有预取技术相比,准确率有了大幅度的提高。

Patent Agency Ranking