基于语义扩展的WEB页面归类方法和系统

    公开(公告)号:CN103294820B

    公开(公告)日:2017-11-10

    申请号:CN201310236697.8

    申请日:2013-06-14

    Abstract: 本发明提供一种基于语义扩展的WEB页面归类方法,包括:提取WEB页面的关键词;将WEB页面的关键词进行语义扩展,得到关键词组合;根据WEB页面的关键词,从预设的语义词库中的类别树中确定所述WEB页面在所述语义词库中的相似类别树,其中,类别树中包含多个节点,每个节点包含多个预设的关键词及其预设权重;将关键词组合与所述相似类别树中每个节点包含的多个预设的关键词进行匹配,若有相同的关键词,则将对应的预设权重进行相加;将所述WEB页面归类在权重最高的所述节点下,同时将所述关键词组合存储在权重最高的节点中,更新所述相似类别树。对应地本发明还提供一种基于语义扩展的WEB页面归类系统。本发明能有效提高WEB页面信息归类的正确率和灵活性。

Patent Agency Ranking