一种基于爬虫的自动化差异检测方法及装置

    公开(公告)号:CN103365967B

    公开(公告)日:2017-02-08

    申请号:CN201310250701.6

    申请日:2013-06-21

    Abstract: 公开了一种基于爬虫的自动化差异检测方法及装置。所述方法包括:获取第一Web系统的第一初始统一资源定位符(URL)以及第二Web系统的第二初始URL;基于爬虫分别对第一初始URL和第二初始URL进行遍历,以不断抓取第一Web系统下的第一页面和第二Web系统下的第二页面,其中,在遍历过程中,执行以下处理:对抓取的第一页面和相应的第二页面进行渲染,分别产生第一网页图像和第二网页图像,对第一网页图像和第二网页图像进行相似性比较,当第一网页图像和第二网页图像不同时,产生差异页面信息,并且将所述差异页面信息存储在差异页面信息数据库中。

    信息搜索方法及其装置
    2.
    发明授权

    公开(公告)号:CN103995847B

    公开(公告)日:2017-08-18

    申请号:CN201410189078.2

    申请日:2014-05-06

    Abstract: 本发明提出一种信息搜索方法和装置。其中,方法包括:获得用户在客户端输入的搜索词;根据搜索词确定搜索词所属的类别信息,获得搜索词所属类别信息对应的知识图谱;以及向客户端返回搜索词所属类别信息对应的知识图谱,以使客户端以结构化信息的形式展现知识图谱中包含的信息。本发明实施例的信息搜索方法,通过服务器获得搜索词所属类别信息对应的知识图谱,并通过客户端以结构化信息的形式展现知识图谱中包含的信息,丰富了根据搜索词获得的信息内容,还为用户提供了帮助用户进行决策的信息,使用户能够更加快捷、方便地获得所需的信息,并以此做出决策,提升了用户体验。

    一种输入提示方法和装置

    公开(公告)号:CN104462465A

    公开(公告)日:2015-03-25

    申请号:CN201410787864.2

    申请日:2014-12-17

    CPC classification number: G06F17/30864

    Abstract: 本发明公开了一种输入提示方法和装置,方法包括:获得用户当前的已输入内容;通过规则匹配识别所述已输入内容中的待提示内容,所述待提示内容是所述已输入内容中的部分内容;使用所述待提示内容进行检索,并显示检索到的所述待提示内容对应的输入提示结果。装置包括:已输入内容获取模块,用于获得用户当前的已输入内容;待提示内容识别模块,用于通过规则匹配识别已输入内容中的待提示内容,所述待提示内容是已输入内容中的部分内容;待提示内容检索模块,用于使用待提示内容进行检索;输入提示结果显示模块,用于显示检索到的待提示内容对应的输入提示结果。本发明实现了减小输入提示结果对索引库的依赖,提高输入提示召回率,提升用户体验。

    信息搜索方法及其装置
    4.
    发明公开

    公开(公告)号:CN103995847A

    公开(公告)日:2014-08-20

    申请号:CN201410189078.2

    申请日:2014-05-06

    Abstract: 本发明提出一种信息搜索方法和装置。其中,方法包括:获得用户在客户端输入的搜索词;根据搜索词确定搜索词所属的类别信息,获得搜索词所属类别信息对应的知识图谱;以及向客户端返回搜索词所属类别信息对应的知识图谱,以使客户端以结构化信息的形式展现知识图谱中包含的信息。本发明实施例的信息搜索方法,通过服务器获得搜索词所属类别信息对应的知识图谱,并通过客户端以结构化信息的形式展现知识图谱中包含的信息,丰富了根据搜索词获得的信息内容,还为用户提供了帮助用户进行决策的信息,使用户能够更加快捷、方便地获得所需的信息,并以此做出决策,提升了用户体验。

    一种基于爬虫的自动化差异检测方法及装置

    公开(公告)号:CN103365967A

    公开(公告)日:2013-10-23

    申请号:CN201310250701.6

    申请日:2013-06-21

    Abstract: 公开了一种基于爬虫的自动化差异检测方法及装置。所述方法包括:获取第一Web系统的第一初始统一资源定位符(URL)以及第二Web系统的第二初始URL;基于爬虫分别对第一初始URL和第二初始URL进行遍历,以不断抓取第一Web系统下的第一页面和第二Web系统下的第二页面,其中,在遍历过程中,执行以下处理:对抓取的第一页面和相应的第二页面进行渲染,分别产生第一网页图像和第二网页图像,对第一网页图像和第二网页图像进行相似性比较,当第一网页图像和第二网页图像不同时,产生差异页面信息,并且将所述差异页面信息存储在差异页面信息数据库中。

Patent Agency Ranking