-
公开(公告)号:CN110020050A
公开(公告)日:2019-07-16
申请号:CN201711048560.4
申请日:2017-10-31
申请人: 中博信息技术研究院有限公司
IPC分类号: G06F16/951
摘要: 本发明公开了一种基于标准文献的智能抓取规则配置技术实现方法,属于标准文献网络自动采集技术领域,通过预先配置好不同类型的站点抓取模板,根据标准文献在各个阶段的所展现的文本信息,自动抓取互联网上标准文献的信息保存至本地库,自动更新标准题录信息,开发符合标准特性的网页抓取工具,根据国内常用标准公告站点定制化配置,实现标准文献资料的自动实时采集。本发明改变原先由人工方式每天从各个站点跟踪标准文献信息,并手动进行标准信息抓取,大大减少了员工工作量和提高数据准确性,提高了本地标准库文献资料的实时性、全面性。
-
公开(公告)号:CN110020050B
公开(公告)日:2022-11-15
申请号:CN201711048560.4
申请日:2017-10-31
申请人: 中博信息技术研究院有限公司
IPC分类号: G06F16/951
摘要: 本发明公开了一种基于标准文献的智能抓取规则配置技术实现方法,属于标准文献网络自动采集技术领域,通过预先配置好不同类型的站点抓取模板,根据标准文献在各个阶段的所展现的文本信息,自动抓取互联网上标准文献的信息保存至本地库,自动更新标准题录信息,开发符合标准特性的网页抓取工具,根据国内常用标准公告站点定制化配置,实现标准文献资料的自动实时采集。本发明改变原先由人工方式每天从各个站点跟踪标准文献信息,并手动进行标准信息抓取,大大减少了员工工作量和提高数据准确性,提高了本地标准库文献资料的实时性、全面性。
-