-
公开(公告)号:CN119474170A
公开(公告)日:2025-02-18
申请号:CN202411551913.2
申请日:2024-11-01
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F16/2458 , G06F16/22 , G06F17/18
Abstract: 本发明涉及数据库管理和优化技术领域,具体涉及一种数据库统计信息高频值修正方法,采用无放回取样依次对初步的MCV列表内值进行概率估算;对所有MCV值的概率进行修正处理;对比修正处理后的该值的置信区间的下界行数与其在所述样本数据中出现的行数;若样本数据中的行数大于置信区间的下限则认为该值为MCV,保留;否则,将该值从初步的MCV列表中移除;保留的MCV值组成偏差更小、修正后的MCV值列表。采用了超几何分布的方差和标准差来修正MCV的概率,经过修正处理后,可得到偏差更小的MCV值列表,较现有技术很大地提高了MCV信息准确度。