-
公开(公告)号:CN114328606A
公开(公告)日:2022-04-12
申请号:CN202111659306.4
申请日:2021-12-30
Applicant: 星环信息科技(上海)股份有限公司
IPC: G06F16/2453 , G06F16/2455
Abstract: 本申请实施例公开了一种SQL执行效率的提高方法、设备及存储介质。其中,方法包括:获取目标SQL的运算参与表的基本信息和运算参与操作的类型;基于基本信息和类型,从运算参与操作中识别可优化操作;判断各可优化操作是否符合预设条件,并在可优化操作符合预设条件的情况下,确定各可优化操作的初始执行代价以及添加聚合操作后各可优化操作的目标执行代价;若初始执行代价和目标执行代价满足预设优化条件,将添加聚合操作后的可优化操作确定为可优化操作的替换操作;利用替换操作对目标SQL中对应的可优化操作进行替换,以提高目标SQL的执行效率。借助聚合操作,可以减少重复元素,避免对重复元素的重复计算,从而提高目标SQL的执行效率和计算性能。
-
公开(公告)号:CN116662454A
公开(公告)日:2023-08-29
申请号:CN202310401084.9
申请日:2023-04-15
Applicant: 复旦大学 , 星环信息科技(上海)股份有限公司
IPC: G06F16/28 , G06F16/2453 , G06F18/23213 , G06N3/04 , G06N3/08
Abstract: 本发明属于数据库查询技术领域,具体为一种基于分组掩码自回归模型的查询基数估计方法。本发明包括列数据分组预处理、分组掩码神经网络基数估计模型训练;列数据分组预处理将单表数据进行分组排序,使模型更好的学习到其中的联合概率分布;分组掩码神经网络基数估计模型通过位置编码以不同次序学习部分列的分布,模型训练分为数据训练、混合掩码训练、直接查询训练三个阶段且混合训练,组合不同的数据集对模型进行训练,降低模型的训练时间;从数据库系统执行日志中记录误差较大的查询信息并加入三阶段训练的数据中,提高模型的训练效率。本发明可以减少传统自回归模型进行基数估计时的查询误差,减少时耗,使得模型可以更快、更稳定用于基数估计。
-
公开(公告)号:CN116521719A
公开(公告)日:2023-08-01
申请号:CN202310401083.4
申请日:2023-04-15
Applicant: 复旦大学 , 星环信息科技(上海)股份有限公司
IPC: G06F16/2453 , G06F16/2455 , G06N3/084 , G06N3/04 , G06F16/22
Abstract: 本发明属于数据库查询技术领域,具体为一种基于代价估计的查询优化系统。本发明包括系统信息提取器、基于深度学习的代价估计模型;系统信息器将数据库管理系统的存储、执行模型等信息处理成为结构化数据以供模型使用;基于深度学习的代价估计模型能够根据不同的系统信息,通过历史执行记录建立从查询到代价的映射关系,从而对未知查询的代价进行估计;代价估计模型的训练采用分层训练策略,可以帮助模型从成批的训练数据中进行学习,提高模型训练的内存利用率,减小训练震荡,加速模型收敛。本发明可以帮助数据库优化器选择正确执行计划,最终提高数据库整体的查询执行效率。
-
公开(公告)号:CN114328606B
公开(公告)日:2022-11-29
申请号:CN202111659306.4
申请日:2021-12-30
Applicant: 星环信息科技(上海)股份有限公司
IPC: G06F16/2453 , G06F16/2455
Abstract: 本申请实施例公开了一种SQL执行效率的提高方法、设备及存储介质。其中,方法包括:获取目标SQL的运算参与表的基本信息和运算参与操作的类型;基于基本信息和类型,从运算参与操作中识别可优化操作;判断各可优化操作是否符合预设条件,并在可优化操作符合预设条件的情况下,确定各可优化操作的初始执行代价以及添加聚合操作后各可优化操作的目标执行代价;若初始执行代价和目标执行代价满足预设优化条件,将添加聚合操作后的可优化操作确定为可优化操作的替换操作;利用替换操作对目标SQL中对应的可优化操作进行替换,以提高目标SQL的执行效率。借助聚合操作,可以减少重复元素,避免对重复元素的重复计算,从而提高目标SQL的执行效率和计算性能。
-
-
-