一种文档数据库多表连接查询方法及装置

    公开(公告)号:CN117349321B

    公开(公告)日:2024-03-05

    申请号:CN202311643055.X

    申请日:2023-12-04

    Abstract: 本发明公开了一种文档数据库多表连接查询方法及装置,涉及数据处理技术领域。该方法的一具体实施方式包括:基于数据表的连接关系确定连接模式;将上述连接模式中的数据表转换为引用表,采用连接键作为分片键,对上述引用表进行分片;将分片后的引用表分布在分布式集群中的每个节点中;将查询指令分布至上述分布式集群中的节点上,并基于查询指令进行数据查询;汇总上述分布式集群中的每个节点的查询结果,生成总查询结果并进行反馈。该实施方式通过将连接键作为引用表的分片键,具有数值接近的分片键的文档位于相同分片,将分片平均分布至不同的节点中,使得在进行查询时,每个节点只需要对本地的数据进行查询,提高了数据读取效率。

    一种文档数据库多表连接查询方法及装置

    公开(公告)号:CN117349321A

    公开(公告)日:2024-01-05

    申请号:CN202311643055.X

    申请日:2023-12-04

    Abstract: 本发明公开了一种文档数据库多表连接查询方法及装置,涉及数据处理技术领域。该方法的一具体实施方式包括:基于数据表的连接关系确定连接模式;将上述连接模式中的数据表转换为引用表,采用连接键作为分片键,对上述引用表进行分片;将分片后的引用表分布在分布式集群中的每个节点中;将查询指令分布至上述分布式集群中的节点上,并基于查询指令进行数据查询;汇总上述分布式集群中的每个节点的查询结果,生成总查询结果并进行反馈。该实施方式通过将连接键作为引用表的分片键,具有数值接近的分片键的文档位于相同分片,将分片平均分布至不同的节点中,使得在进行查询时,每个节点只需要对本地的数据进行查询,提高了数据读取效率。

    一种数据流量控制方法及装置

    公开(公告)号:CN117319312A

    公开(公告)日:2023-12-29

    申请号:CN202311615781.0

    申请日:2023-11-29

    Abstract: 本发明公开了一种数据流量控制方法及装置,涉及金融技术领域。该方法的一具体实施方式包括:通过流量预测模型,预测未来第一预设时间范围内多个时段分别对应的金融资产序号集合的流量值;根据流量值,确定多个时段对应的目标窗口时长,以根据目标窗口时长设置滚动窗口以接收金融资产序号集合;通过根据目标窗口时长设置的滚动窗口,分批接收金融资产序号集合;将接收到的金融资产序号集合,分批发送给下游节点,以使下游节点对金融资产序号集合进行处理。该实施方式实现了根据流量预测值,在线调整窗口,避免了流量波动导致的下游系统崩溃,造成数据丢失和错误,或计算资源浪费的情况;窗口滚动自增以接收数据,避免了窗口调整造成的数据丢失。

    一种数据片段处理时间计算方法及装置

    公开(公告)号:CN117312761A

    公开(公告)日:2023-12-29

    申请号:CN202311597815.8

    申请日:2023-11-28

    Abstract: 本发明公开了一种数据片段处理时间计算方法及装置,涉及数据处理技术领域。该方法包括:接收数据片段,标识数据片段的处理开始时间;对每个数据片段的数据准备过程进行子任务划分,并基于每个子任务进行数据准备;响应于数据准备完成,确定每个子任务的结束标识数据,并将其他数据作为非结束标识数据;采用统计算子获取目标数据片段的结束标识数据和非结束标识数据,分别计算结束数据量和计算数据量;获取目标数据片段的处理开始时间;基于目标数据片段的结束数据量和计算数据量,以及目标数据片段的处理开始时间,计算目标数据片段的处理时间。该实施方式降低了处理时间计算的复杂性,解决了处理时间计算过程中不同节点的时钟偏差问题。

    一种数据片段处理时间计算方法及装置

    公开(公告)号:CN117312761B

    公开(公告)日:2024-03-05

    申请号:CN202311597815.8

    申请日:2023-11-28

    Abstract: 本发明公开了一种数据片段处理时间计算方法及装置,涉及数据处理技术领域。该方法包括:接收数据片段,标识数据片段的处理开始时间;对每个数据片段的数据准备过程进行子任务划分,并基于每个子任务进行数据准备;响应于数据准备完成,确定每个子任务的结束标识数据,并将其他数据作为非结束标识数据;采用统计算子获取目标数据片段的结束标识数据和非结束标识数据,分别计算结束数据量和计算数据量;获取目标数据片段的处理开始时间;基于目标数据片段的结束数据量和计算数据量,以及目标数据片段的处理开始时间,计算目标数据片段的处理时间。该实施方式降低了处理时间计算的复杂性,解决了处理时间计算过程中不同节点的时钟偏差问题。

Patent Agency Ranking