一种动态网页的采集方法及装置

    公开(公告)号:CN101996196A

    公开(公告)日:2011-03-30

    申请号:CN200910091691.X

    申请日:2009-08-28

    Inventor: 孙宏伟 胡珉

    Abstract: 本发明公开了一种动态网页的采集方法及装置,其中,该方法包括:在客户端侧预先设置模拟用户行为功能,客户端侧和提供动态网页信息的服务器建立链接;客户端侧通过预先设置的模拟用户行为功能下载动态网页信息;客户端侧通过设置的模拟用户行为功能对下载的动态网页信息中的表项解析、填写并发送给服务器;客户端侧从该服务器中得到的链接地址采集动态网页。本发明提供的方法及装置能够采集动态网页。

    一种APP索引库的创建方法及装置、搜索APP的方法及装置

    公开(公告)号:CN106547748A

    公开(公告)日:2017-03-29

    申请号:CN201510590959.X

    申请日:2015-09-16

    Inventor: 胡珉

    Abstract: 本发明提供了一种APP索引库的创建方法及装置、搜索APP的方法及装置,该APP索引库的创建方法包括:获取与第一APP相关的基本信息和隐含信息,其中,基本信息包括第一APP的提供商提供的对第一APP的基本介绍信息,隐含信息包括用户对第一APP的评论信息;分别建立基本信息、隐含信息与第一APP的索引关系,并保存在索引库中。本发明的方案,将获取的用户对APP的评论信息添加到索引库中,解决了目前APP搜索只能针对名称、关键词、简介等少数字段进行搜索的问题,满足用户的更多搜索需求。

    一种检索信息的缓存方法和搜索引擎系统

    公开(公告)号:CN102541924B

    公开(公告)日:2016-01-20

    申请号:CN201010614750.X

    申请日:2010-12-21

    Abstract: 本发明实施例公开了一种检索信息的缓存方法和搜索引擎系统,通过应用本发明实施例所提出的技术方案,可以对检索信息进行分级的缓存,除了缓存最终的检索请求对应的结果页面外,还缓存一些占用空间比较小的中间检索结果信息,从而,使缓存的检索提问总量得到了大幅提高,加快检索速度,改善了用户体验。

    数据采集系统和方法
    24.
    发明授权

    公开(公告)号:CN102375837B

    公开(公告)日:2014-12-31

    申请号:CN201010257383.2

    申请日:2010-08-19

    Abstract: 本申请提供了数据采集系统和方法。数据采集系统可包括多个调度服务器和多个采集服务器。调度服务器可包括生成单元,生成采集任务;发送单元,将采集任务发送给多个采集服务器中当前处于待接收状态的采集服务器。采集服务器可包括拆分单元,将接收到的采集任务拆分为多个子任务;子任务发送单元,将多个子任务发送给多个调度服务器中当前处于待接收状态的调度服务器。调度服务器接收到的子任务可由调度服务器的发送单元发送给多个采集服务器中当前处于待接收状态的采集服务器。采集服务器可进一步包括执行单元,根据所接收的子任务,执行数据采集。通过本申请,可提高数据采集的效率,并能够利用分布式并行处理能力,实现针对海量数据的数据采集。

    一种数据搜索方法及系统
    25.
    发明公开

    公开(公告)号:CN102411584A

    公开(公告)日:2012-04-11

    申请号:CN201010291290.1

    申请日:2010-09-25

    Abstract: 本发明公开了一种数据搜索方法及系统,包括:采集网页数据和专业数据;并根据采集的网页数据和专业数据分别建立网页数据记录库和专业数据记录库,其中,网页数据记录库中包括若干个网页数据记录,专业数据记录库中包括若干个专业数据记录;并分别建立关键字与网页数据记录的第一索引和关键字与专业数据记录的第二索引;并在接收到用户的第一搜索请求后,按照第一搜索请求中携带的检索关键字查询建立的第一索引和第二索引,获得与检索关键字对应的各网页数据记录和各专业数据记录以及将获得的各网页数据记录和各专业数据记录作为第一搜索结果返回给用户。采用本发明实施例提供的方案,能够为用户提供更准确的信息搜索。

    数据采集系统和方法
    26.
    发明公开

    公开(公告)号:CN102375837A

    公开(公告)日:2012-03-14

    申请号:CN201010257383.2

    申请日:2010-08-19

    Abstract: 本发明提供了数据采集系统和方法。数据采集系统可包括多个调度服务器和多个采集服务器。调度服务器可包括生成单元,生成采集任务;发送单元,将采集任务发送给多个采集服务器中当前处于待接收状态的采集服务器。采集服务器可包括拆分单元,将接收到的采集任务拆分为多个子任务;子任务发送单元,将多个子任务发送给多个调度服务器中当前处于待接收状态的调度服务器。调度服务器接收到的子任务可由调度服务器的发送单元发送给多个采集服务器中当前处于待接收状态的采集服务器。采集服务器可进一步包括执行单元,根据所接收的子任务,执行数据采集。通过本发明,可提高数据采集的效率,并能够利用分布式并行处理能力,实现针对海量数据的数据采集。

    对中文查询词进行纠错的方法及其装置

    公开(公告)号:CN101989282A

    公开(公告)日:2011-03-23

    申请号:CN200910090196.7

    申请日:2009-07-31

    Abstract: 本发明公开了一种对中文查询词进行纠错的方法及其装置,其中该方法包括将接收到的中文查询词转换为拼音,并确定每个拼音的首字母构成的字母串;在各字母串和中文查询词集之间的对应关系中,索引与确定的字母串对应的中文查询词集;在索引到的中文查询词集包含的各中文查询词拼音和与中文查询词拼音对应的中文查询词子集的对应关系中,按照转换得到的中文查询词拼音索引对应的中文查询词子集;在接收的中文查询词与索引到的中文查询词子集中包含的中文查询词存在相同时,确定接收到的中文查询词无需纠错;否则将索引到的中文查询词子集中的中文查询词作为纠错词进行推荐。本发明可以提高对用户输入的中文查询词进行纠错的速度。

Patent Agency Ranking