一种数据库查询优化方法

    公开(公告)号:CN114116778B

    公开(公告)日:2025-01-03

    申请号:CN202111130449.6

    申请日:2021-09-26

    Abstract: 本发明公开了一种数据库查询优化方法,设计物理优化空间,获得多组查询指令;根据多组查询指令,为查询语句生成多组执行计划将多组执行计划编码为多组特征向量集;根据多组执行计划的多组特征向量集,设计预测模型来获得多组执行计划的多个预计执行时间;根据多组执行计划的多个预计执行时间,设计采样方法来选择一组执行计划;将选择的执行计划发送到执行器,获得真实执行时间,进而将选择的执行计划的特征向量集、预计执行时间和真实执行时间作为数据样本来训练预测模型,最终提升查询性能;本发明解决了传统的查询优化器生成较差的执行计划,最终导致查询性能不佳的问题。

    一种基于二元高斯非齐次泊松过程的单车数量预测方法

    公开(公告)号:CN109325625A

    公开(公告)日:2019-02-12

    申请号:CN201811141977.X

    申请日:2018-09-28

    Abstract: 本发明公开一种基于二元高斯非齐次泊松过程的单车数量预测方法,属于数据挖掘预测技术领域,根据单车站点历史数据,利用泊松理论,建立非齐次泊松模型,并考虑环境参数的影响,建立最终的预测模型,对时间序列进行模拟并对单车数量进行修正,只需要单车站点历史的单车使用数据就能进行预测,不仅能够在相应数据获取受限的情况下,实现站点单车数量的预测,且可减小天气等不实时更新数据对预测结果的影响,显著提高站点单车在未来的一段时间内的数量预测的准确性和及时性。

    基于伪负样本的数据平衡方法及提高数据分类性能的方法

    公开(公告)号:CN109272056B

    公开(公告)日:2021-09-21

    申请号:CN201811280097.0

    申请日:2018-10-30

    Abstract: 本发明公开了一种基于伪负样本的数据平衡方法及提高数据分类性能的方法,包括步骤:步骤1:正负样本分离,得到正样本集和负样本集;步骤2:计算得到负样本皮尔逊相关系数集合;步骤3:将伪负样本集和被挑选样本集初始化;步骤4:使用最大相关‑最小冗余方法计算权重,得到权重集合;步骤5:挑选出最大权重,更新伪负样本集和被挑选样本集;步骤6:重复步骤4和步骤5,直到挑选出伪负样本集;步骤7:将挑选出的伪负样本集并入正样本集,同时,从所述负样本集中剔除挑选出的伪负样本集;本发明首次提出并定义了伪负样本的概念,提出的算法可提高数据分类准确性,进而提高分类器性能,特别是在处理不平衡的生物信息数据方面优势明显。

Patent Agency Ranking