用于获取数据的方法和装置

    公开(公告)号:CN108170843A

    公开(公告)日:2018-06-15

    申请号:CN201810044267.9

    申请日:2018-01-17

    CPC classification number: G06F16/9535

    Abstract: 本申请实施例公开了用于获取数据的方法和装置。该方法的一具体实施方式包括:从种子信息集合中依次选取目标种子信息;对于所依次选取的每一个目标种子信息,基于该目标种子信息是否带有用于指示优先处理的优先标识,将该目标种子信息归入优先目标种子信息队列或常规目标种子信息队列;依次从该优先目标种子信息队列的目标种子信息、该常规目标种子信息队列的目标种子信息中提取链接,获取所提取的链接对应的网页数据。该实施方式提高了数据获取的灵活性。

    用于获取数据的方法和装置

    公开(公告)号:CN108268635B

    公开(公告)日:2022-06-24

    申请号:CN201810044597.8

    申请日:2018-01-17

    Abstract: 本申请实施例公开了用于获取数据的方法和装置。该方法的一具体实施方式包括:确定目标网站是否未登录;响应于确定该目标网站未登录,识别该目标网站的登录页面中的登录表单,并确定该登录表单中的各个字段的类别;对于该登录表单中的每一个字段,输入与该字段的类别相对应的值,以登录该目标网站;获取登录该目标网站后所呈现的页面的页面数据。该实施方式提高了信息获取的灵活性。

    用于获取数据的方法和装置

    公开(公告)号:CN108170843B

    公开(公告)日:2019-07-12

    申请号:CN201810044267.9

    申请日:2018-01-17

    Abstract: 本申请实施例公开了用于获取数据的方法和装置。该方法的一具体实施方式包括:从种子信息集合中依次选取目标种子信息;对于所依次选取的每一个目标种子信息,基于该目标种子信息是否带有用于指示优先处理的优先标识,将该目标种子信息归入优先目标种子信息队列或常规目标种子信息队列;依次从该优先目标种子信息队列的目标种子信息、该常规目标种子信息队列的目标种子信息中提取链接,获取所提取的链接对应的网页数据。该实施方式提高了数据获取的灵活性。

    用于生成信息的方法和装置

    公开(公告)号:CN108171276B

    公开(公告)日:2019-07-23

    申请号:CN201810045681.1

    申请日:2018-01-17

    Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:提取目标企业的企业信息,其中,该企业信息包括企业名称和经营范围信息;从该企业名称和该经营范围信息中提取第一特征信息;从其余信息中提取第二特征信息;将该第一特征信息与第二特征信息进行融合,将融合后的特征信息输入至预先训练的行业识别模型,得到该目标企业的行业类别。该实施方式提高了信息生成的灵活性。

    用于获取数据的方法和装置

    公开(公告)号:CN108268635A

    公开(公告)日:2018-07-10

    申请号:CN201810044597.8

    申请日:2018-01-17

    Abstract: 本申请实施例公开了用于获取数据的方法和装置。该方法的一具体实施方式包括:确定目标网站是否未登录;响应于确定该目标网站未登录,识别该目标网站的登录页面中的登录表单,并确定该登录表单中的各个字段的类别;对于该登录表单中的每一个字段,输入与该字段的类别相对应的值,以登录该目标网站;获取登录该目标网站后所呈现的页面的页面数据。该实施方式提高了信息获取的灵活性。

Patent Agency Ranking