-
公开(公告)号:CN117932122A
公开(公告)日:2024-04-26
申请号:CN202410025426.6
申请日:2024-01-08
Applicant: 星环信息科技(上海)股份有限公司 , 复旦大学
IPC: G06F16/903 , G06F16/901 , G06F18/22
Abstract: 本发明属于图数据处理技术领域,具体为一种基于图嵌入距离预测的子图匹配算法的图数据库查询方法;基于图嵌入将数据图结构信息编码成向量,并将这一过程放在离线阶段,不影响在线查询阶段的响应效率;通过图向量的运算预测距离并基于距离预测的结果对候选集进行剪枝,具有向量运算计算量较小、硬件实现效率高的优点,同时可以获得基于高阶信息的剪枝结果。对比现有技术每次查询都会产生与查询图和数据图边数的乘积成正比的在线计算量,本方案具有在线响应时间上的优势。
-
公开(公告)号:CN116383454B
公开(公告)日:2024-01-30
申请号:CN202310377530.7
申请日:2023-04-10
Applicant: 星环信息科技(上海)股份有限公司
IPC: G06F16/903 , G06F16/901
Abstract: 本发明公开了图数据库的数据查询方法、电子设备及存储介质。该方法包括:对所获取的待查询语句进行处理,确定执行计划,执行计划至少包括选择计划和选择聚合计划;通过选择计划进行编码数据选择,得到目标编码信息;通过选择聚合计划对所述目标编码信息进行数据还原,根据还原后的数据确定查询结果,解决了图数据库属性裁剪失效时查询语句执行时间长以及占用大量资源的问题,通过选择计划可以将执行过程中涉及的点边数据通过采用相应的编码数据替代,在查询过程中仅需编码数据,无需在查询语句执行过程中获取并缓存相应的点和边的所有属性信息,节省资源,提高了处理速度,节省数据处理时间。
-
公开(公告)号:CN112732715A
公开(公告)日:2021-04-30
申请号:CN202011621853.9
申请日:2020-12-31
Applicant: 星环信息科技(上海)股份有限公司
Abstract: 本发明实施例公开了一种数据表关联方法、设备以及存储介质。该方法包括:获取数据表对的关联指令,确定关联进程中的各个任务节点的任务信息;数据表对包括查找表和扫描表,任务信息包括扫描表中分配给对应的任务节点的扫描子表;对于关联进程中的每个任务节点,根据负载信息与预测策略的匹配结果,确定任务节点的关联算法模型,根据关联算法模型关联查找表和扫描子表,得到关联子结果;预设策略包括负载信息与关联算法模型的关联关系,负载信息包括扫描子表的数据量和/或关联进程的占用资源;根据各个任务节点的关联子结果确定关联指令的关联结果。本发明实施例根据任务节点和关联进程的负载自适应地选择关联算法,提高了整体的执行性能。
-
公开(公告)号:CN118227839A
公开(公告)日:2024-06-21
申请号:CN202410289952.3
申请日:2024-03-14
Applicant: 复旦大学 , 星环信息科技(上海)股份有限公司
IPC: G06F16/901 , G06F16/906 , G06F16/903 , G06N20/00
Abstract: 本发明属于图数据库技术领域,具体为一种基于强化学习和图摘要的图数据库查询成本估计方法。本发明通过对原始图数据库进行抽样和聚类生成图摘要;根据图摘要估计不同查询执行计划的成本;同时,采用DQN模型作为强化学习模型,对模型进行训练;模型输入是查询计划的特征向量,输是每个查询执行计划的预期奖励值。DQN模型通过训练学会选择成本最小的查询执行计划;在接收到用户路径查询请求时,模型首先生成所有可能的查询执行计划;然后,利用图摘要估计每个计划的成本,并将计划特征向量输入到模型中;最后,选择预期奖励值最高的查询执行计划进行执行。本发明在不访问原始数据的情况下进行查询成本估计,降低计算和存储的开销,提高查询效率。
-
公开(公告)号:CN112732715B
公开(公告)日:2023-08-25
申请号:CN202011621853.9
申请日:2020-12-31
Applicant: 星环信息科技(上海)股份有限公司
Abstract: 本发明实施例公开了一种数据表关联方法、设备以及存储介质。该方法包括:获取数据表对的关联指令,确定关联进程中的各个任务节点的任务信息;数据表对包括查找表和扫描表,任务信息包括扫描表中分配给对应的任务节点的扫描子表;对于关联进程中的每个任务节点,根据负载信息与预测策略的匹配结果,确定任务节点的关联算法模型,根据关联算法模型关联查找表和扫描子表,得到关联子结果;预设策略包括负载信息与关联算法模型的关联关系,负载信息包括扫描子表的数据量和/或关联进程的占用资源;根据各个任务节点的关联子结果确定关联指令的关联结果。本发明实施例根据任务节点和关联进程的负载自适应地选择关联算法,提高了整体的执行性能。
-
公开(公告)号:CN116383454A
公开(公告)日:2023-07-04
申请号:CN202310377530.7
申请日:2023-04-10
Applicant: 星环信息科技(上海)股份有限公司
IPC: G06F16/903 , G06F16/901
Abstract: 本发明公开了图数据库的数据查询方法、电子设备及存储介质。该方法包括:对所获取的待查询语句进行处理,确定执行计划,执行计划至少包括选择计划和选择聚合计划;通过选择计划进行编码数据选择,得到目标编码信息;通过选择聚合计划对所述目标编码信息进行数据还原,根据还原后的数据确定查询结果,解决了图数据库属性裁剪失效时查询语句执行时间长以及占用大量资源的问题,通过选择计划可以将执行过程中涉及的点边数据通过采用相应的编码数据替代,在查询过程中仅需编码数据,无需在查询语句执行过程中获取并缓存相应的点和边的所有属性信息,节省资源,提高了处理速度,节省数据处理时间。
-
-
-
-
-