一种基于标准文献的智能抓取规则配置技术实现方法

    公开(公告)号:CN110020050A

    公开(公告)日:2019-07-16

    申请号:CN201711048560.4

    申请日:2017-10-31

    IPC分类号: G06F16/951

    摘要: 本发明公开了一种基于标准文献的智能抓取规则配置技术实现方法,属于标准文献网络自动采集技术领域,通过预先配置好不同类型的站点抓取模板,根据标准文献在各个阶段的所展现的文本信息,自动抓取互联网上标准文献的信息保存至本地库,自动更新标准题录信息,开发符合标准特性的网页抓取工具,根据国内常用标准公告站点定制化配置,实现标准文献资料的自动实时采集。本发明改变原先由人工方式每天从各个站点跟踪标准文献信息,并手动进行标准信息抓取,大大减少了员工工作量和提高数据准确性,提高了本地标准库文献资料的实时性、全面性。

    一种基于标准文献的智能抓取规则配置技术实现方法

    公开(公告)号:CN110020050B

    公开(公告)日:2022-11-15

    申请号:CN201711048560.4

    申请日:2017-10-31

    IPC分类号: G06F16/951

    摘要: 本发明公开了一种基于标准文献的智能抓取规则配置技术实现方法,属于标准文献网络自动采集技术领域,通过预先配置好不同类型的站点抓取模板,根据标准文献在各个阶段的所展现的文本信息,自动抓取互联网上标准文献的信息保存至本地库,自动更新标准题录信息,开发符合标准特性的网页抓取工具,根据国内常用标准公告站点定制化配置,实现标准文献资料的自动实时采集。本发明改变原先由人工方式每天从各个站点跟踪标准文献信息,并手动进行标准信息抓取,大大减少了员工工作量和提高数据准确性,提高了本地标准库文献资料的实时性、全面性。