一种基于变异思想改进粒子群算法的主题爬虫系统及方法

    公开(公告)号:CN109766486B

    公开(公告)日:2023-03-31

    申请号:CN201811488041.4

    申请日:2018-12-06

    Abstract: 本发明公开了一种基于变异思想改进粒子群算法的主题爬虫系统及方法,涉及种子集选取、页面初始权值计算与算法改进三个部分。种子集选取模块主要是基于主题相关页面的点击率获取3种不同类型的种子页面,其中包括人工去重操作;页面初始权值计算模块包括网页文本预处理、关键词选择及权值计算三个步骤;算法改进模块是基于变异思想改进粒子群算法。本爬虫系统对主题爬虫寻优精度不高的问题提供了思路。

    一种基于交互关系的用户影响力分析方法

    公开(公告)号:CN109726319B

    公开(公告)日:2020-11-10

    申请号:CN201811516605.0

    申请日:2018-12-12

    Abstract: 本发明属于数据挖掘与社交网络研究领域,涉及一种基于交互关系的用户影响力分析方法,包括获取用户信息,构建微博交互信息模型来计算用户交互信息和用户属性决定的影响力;设置用户的影响力的初始值;通过微博交互信息模型获取转发强度、评论强度和提及强度,并通过转发强度、评论强度和提及强度计算交互强度因子;交互强度因子改进PageRank算法,并通过改进的PageRank算法测量用户的影响力,得出影响力排名;本发明综合考虑社交网络用户的多种行为、网络结构特点、用户属性等特征能够更加准确的发现和识别微博网络中的影响力个体以及个体在微博网络中的影响力。

    一种基于交互关系的用户影响力分析方法

    公开(公告)号:CN109726319A

    公开(公告)日:2019-05-07

    申请号:CN201811516605.0

    申请日:2018-12-12

    Abstract: 本发明属于数据挖掘与社交网络研究领域,涉及一种基于交互关系的用户影响力分析方法,包括获取用户信息,构建微博交互信息模型来计算用户交互信息和用户属性决定的影响力;设置用户的影响力的初始值;通过微博交互信息模型获取转发强度、评论强度和提及强度,并通过转发强度、评论强度和提及强度计算交互强度因子;交互强度因子改进PageRank算法,并通过改进的PageRank算法测量用户的影响力,得出影响力排名;本发明综合考虑社交网络用户的多种行为、网络结构特点、用户属性等特征能够更加准确的发现和识别微博网络中的影响力个体以及个体在微博网络中的影响力。

    一种基于变异思想改进粒子群算法的主题爬虫系统及方法

    公开(公告)号:CN109766486A

    公开(公告)日:2019-05-17

    申请号:CN201811488041.4

    申请日:2018-12-06

    Abstract: 本发明公开了一种基于变异思想改进粒子群算法的主题爬虫系统及方法,涉及种子集选取、页面初始权值计算与算法改进三个部分。种子集选取模块主要是基于主题相关页面的点击率获取3种不同类型的种子页面,其中包括人工去重操作;页面初始权值计算模块包括网页文本预处理、关键词选择及权值计算三个步骤;算法改进模块是基于变异思想改进粒子群算法。本爬虫系统对主题爬虫寻优精度不高的问题提供了思路。

Patent Agency Ranking