基于深度学习的关系型数据库基数估计方法

    公开(公告)号:CN115269639A

    公开(公告)日:2022-11-01

    申请号:CN202210722637.6

    申请日:2022-06-20

    Abstract: 本发明为基于深度学习的关系型数据库基数估计方法,首先,获取数据库的元数据和统计信息并构建数据库表之间的关系拓扑图;接着,为关系拓扑图的各个节点和连通子图分别建立一个基数估计器;然后,创建训练用的SQL语句,在数据库中执行SQL语句并保存查询结果;将SQL语句和查询结果作为训练数据,对基数估计器进行训练;最后,利用训练后的基数估计器估计基数,若SQL语句只涉及单张数据库表的查询或者连接查询所涉及的数据库表已存在相应的基数估计器,则对基数进行直接估计;否则,将SQL语句拆分为多个子查询,对基数进行间接估计。每个基数估计器只对应于数据库中的单个或部分数据库表,当数据库中的数据改变时,只对部分基数估计器进行更新,降低了更新成本。

    基于RNN双模型的数据流频率估计方法及应用

    公开(公告)号:CN115269321A

    公开(公告)日:2022-11-01

    申请号:CN202210877881.X

    申请日:2022-07-25

    Abstract: 本发明为基于RNN双模型的数据流频率估计方法,该估计方法结合当下流行的循环神经网络模型,将频率估计和神经网络结合在一起,基于RNN和Conservative‑Update Sketch实现了更好的误差控制和更加精确的频率估计。该方法对数据流中数据项的频率进行估计,通过两个RNN神经网络模型对数据流进行分类,将高频数据和低频数据分开存储,降低高频数据和低频数据之间的哈希冲突,从而提高数据流频率估计的精度,由于高频数据单独存储,可以减少高频数据哈希计算的次数,在一定程度上提高了数据流的处理效率。该估计方法应用在网络流量监测中,能够监测网络的突发情况,提高监测的精度和效率。

Patent Agency Ranking