-
公开(公告)号:CN113806611A
公开(公告)日:2021-12-17
申请号:CN202010555544.X
申请日:2020-06-17
申请人: 海信集团有限公司
IPC分类号: G06F16/951 , G06F16/25 , G06F16/28 , G06F16/172
摘要: 本发明提供一种存储搜索引擎结果的方法及设备,该方法包括:响应于管线配置指令,获取配置的至少一个搜索任务分别关联的数据管线,及各数据管线对应的存储位置,其中预先定义对应不同存储类型的数据管线;响应于搜索引擎指令进行数据搜索,对各搜索任务获取到的数据,利用该搜索任务对应的数据管线,将获取的数据转换为与该数据管线对应的存储类型,并将转换后的数据存储到与该数据管线对应的存储位置。本发明提供的存储搜索引擎结果的方法及设备,解决了现有爬虫结果的存储方法存在的爬虫结果存储类型少,及存储的数据需要后期更改存储类型和介质的问题。