-
公开(公告)号:CN102693304A
公开(公告)日:2012-09-26
申请号:CN201210160735.1
申请日:2012-05-22
申请人: 北京邮电大学
IPC分类号: G06F17/30
摘要: 本发明提供一种搜索引擎的反馈信息处理方法及搜索引擎,其中方法包括:抓取网页,将所述网页和从所述网页中提取的关键词保存到数据库;使用搜索引擎对所述数据库中的网页记录做索引,生成一索引文件;根据输入的查询关键词,从所述索引文件中获得搜索引擎反馈的包括所述查询关键词的所有网页;根据所有网页的关键词,对网页进行相似度计算;将相似度计算结果符合一预设阈值范围的相似网页合并到一个聚类中。本发明的方案可以使搜索引擎能够对所有的搜索结果进行聚类。
-
公开(公告)号:CN102693304B
公开(公告)日:2014-10-22
申请号:CN201210160735.1
申请日:2012-05-22
申请人: 北京邮电大学
IPC分类号: G06F17/30
摘要: 本发明提供一种搜索引擎的反馈信息处理方法及搜索引擎,其中方法包括:抓取网页,将所述网页和从所述网页中提取的关键词保存到数据库;使用搜索引擎对所述数据库中的网页记录做索引,生成一索引文件;根据输入的查询关键词,从所述索引文件中获得搜索引擎反馈的包括所述查询关键词的所有网页;根据所有网页的关键词,对网页进行相似度计算;将相似度计算结果符合一预设阈值范围的相似网页合并到一个聚类中。本发明的方案可以使搜索引擎能够对所有的搜索结果进行聚类。
-