-
公开(公告)号:CN113761358A
公开(公告)日:2021-12-07
申请号:CN202110509465.X
申请日:2021-05-11
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/9535 , G06F16/33 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种多通道热点发现的方法及多通道热点发现系统,包括以下步骤:S1、筛选阶段,通过一个平台拉取数据流,对其进行过滤,筛选出热点,并且将热点聚合到搜索引擎上,如果没有热点,则进入到汇集阶段;S2、汇集阶段,对不同平台数据流进行处理,得到热点半成品结果集,再存入远程字典里面;S3、融入阶段,根据平台以往的历史去寻找热点;S4、对上述热点数据进行处理,并且做出相似度计算;S5、若是同一个实体则归为同一实体名称,如果不是,则将新的实体名称加进远程字典里面并将结果聚合到搜索引擎中;S6、聚类结束,等待下一个热点索引。提高了信息采集效率和检索性能。使其在海量数据中能够快速的获取热点信息。
-
公开(公告)号:CN113760906A
公开(公告)日:2021-12-07
申请号:CN202110509578.X
申请日:2021-05-11
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种索引管理的方法,包括索引管理器,索引管理器包括服务端和客户端,本发明能够在数据入elasticsearch库时,其索引族由数据发布时间确定而不是数据入库时间确定,且业务检索时不再检索全部索引,而是根据检索的发布时间区间,确定待检索的部分索引族,能够降低业务检索中的消耗,提高检索性能,在海量数据中能够有快速且有针对性的获取目标信息的位置。
-
公开(公告)号:CN113760906B
公开(公告)日:2023-04-14
申请号:CN202110509578.X
申请日:2021-05-11
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种索引管理的方法,包括索引管理器,索引管理器包括服务端和客户端,本发明能够在数据入elasticsearch库时,其索引族由数据发布时间确定而不是数据入库时间确定,且业务检索时不再检索全部索引,而是根据检索的发布时间区间,确定待检索的部分索引族,能够降低业务检索中的消耗,提高检索性能,在海量数据中能够有快速且有针对性的获取目标信息的位置。
-
-