一种网络关键资源页面的自动定位方法

    公开(公告)号:CN101105801A

    公开(公告)日:2008-01-16

    申请号:CN200710098531.9

    申请日:2007-04-20

    Applicant: 清华大学

    Abstract: 一种网络关键资源页面的自动定位方法,属于互联网信息处理领域,其特征在于:它首先从多家搜索引擎用户查询点击信息记录中筛选出具有时效性和代表性的查询主题词,提取出其对应的用户点击结果页面和结果页面的“用户点击率”,得到查询主题集合、关键资源页面候选集和“用户点击分布”;随后对多家搜索引擎的用户查询点击信息记录上得到的“用户点击分布”进行融合,利用“查询可信度”信息得到融合后的“用户点击分布”;最后根据融合后的“用户点击分布”对关键资源页面候选集中的页面进行判定,得到主题相关的关键资源页面。该方法具有计算机自动,准确客观和迅速定位的优点。

    一种基于用户行为信息的搜索引擎检索结果重排序方法

    公开(公告)号:CN101055587A

    公开(公告)日:2007-10-17

    申请号:CN200710099594.6

    申请日:2007-05-25

    Applicant: 清华大学

    Abstract: 本发明属于互联网信息处理领域,其特征在于:它根据单个或多个搜索引擎日志,首先利用查询对应的用户数信息,从中筛选出用户关注的常用查询集合;随后计算常用查询集中各查询对应的用户点击页面对应的用户点击率,若利用多搜索引擎日志信息,则对用户点击率进行合并;根据用户点击率对用户点击页面进行有效筛选,并把相关查询和对应的结果页面地址保存到相关数据库;最后,当用户提交查询需求时,把从用户信息得到的结果和搜索引擎搜索得到的结果进行有效融合,重新排序后返回给用户。该方法具有计算机自动完成,实时有效客观地提交搜索引擎性能的优点。

    一种网络关键资源页面的自动定位方法

    公开(公告)号:CN100507918C

    公开(公告)日:2009-07-01

    申请号:CN200710098531.9

    申请日:2007-04-20

    Applicant: 清华大学

    Abstract: 一种网络关键资源页面的自动定位方法,属于互联网信息处理领域,其特征在于:它首先从多家搜索引擎用户查询点击信息记录中筛选出具有时效性和代表性的查询主题词,提取出其对应的用户点击结果页面和结果页面的“用户点击率”,得到查询主题集合、关键资源页面候选集和“用户点击分布”;随后对多家搜索引擎的用户查询点击信息记录上得到的“用户点击分布”进行融合,利用“查询可信度”信息得到融合后的“用户点击分布”;最后根据融合后的“用户点击分布”对关键资源页面候选集中的页面进行判定,得到主题相关的关键资源页面。该方法具有计算机自动,准确客观和迅速定位的优点。

    一种基于用户行为信息的搜索引擎检索结果重排序方法

    公开(公告)号:CN100507920C

    公开(公告)日:2009-07-01

    申请号:CN200710099594.6

    申请日:2007-05-25

    Applicant: 清华大学

    Abstract: 本发明属于互联网信息处理领域,其特征在于:它根据单个或多个搜索引擎日志,首先利用查询对应的用户数信息,从中筛选出用户关注的常用查询集合;随后计算常用查询集中各查询对应的用户点击页面对应的用户点击率,若利用多搜索引擎日志信息,则对用户点击率进行合并;根据用户点击率对用户点击页面进行有效筛选,并把相关查询和对应的结果页面地址保存到相关数据库;最后,当用户提交查询需求时,把从用户信息得到的结果和搜索引擎搜索得到的结果进行有效融合,重新排序后返回给用户。该方法具有计算机自动完成,实时有效客观地提交搜索引擎性能的优点。

Patent Agency Ranking