• 专利标题: 基于节点属性标签传播的网页聚类方法
  • 专利标题(英): Webpage clustering method based on node property label propagation
  • 申请号: CN201210176912.5
    申请日: 2012-05-31
  • 公开(公告)号: CN102768670A
    公开(公告)日: 2012-11-07
  • 发明人: 张乐君夏磊张健沛杨静国林
  • 申请人: 哈尔滨工程大学
  • 申请人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • 专利权人: 哈尔滨工程大学
  • 当前专利权人: 哈尔滨工程大学
  • 当前专利权人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • 主分类号: G06F17/30
  • IPC分类号: G06F17/30
基于节点属性标签传播的网页聚类方法
摘要:
本发明提供的是一种基于节点属性标签传播的网页聚类方法。依据网页的链接关系构造拓扑结构图模型;为图模型中每个节点构建属性特征向量;初始化网络中的节点标签;依据拓扑结构及节点属性迭代更新节点的标签;定义停止更新节点标签的条件。本发明无需了解网页分组的数量和规模等先验知识或者预先定义临界值等参数,只需提取互联网络的拓扑关系及标记网页特征的属性信息,就可以在近乎线性的时间内有效地、高质量地实现网页的聚类。由于该算法概念简单,易于理解及实现,具有较低的时间复杂度,且能够产生优质的网络聚类结果,因此适用于规模庞大的互联网络。
公开/授权文献
0/0