一种读优化的内存数据库Trie树索引方法

    公开(公告)号:CN105117417B

    公开(公告)日:2018-04-17

    申请号:CN201510459589.6

    申请日:2015-07-30

    Abstract: 一种读优化的内存数据库Trie树索引方法,对于字符型数据,提供了O(1)的写入和查询时间复杂度,优化后的Trie树结构通过动态的分配前缀节点,减少了索引结构所占用的内存空间,通过使用节点内部的排序链表,完成范围查询操作,对list和set数据类型的支持扩展了数据库的数据格式,使数据库能有效的应对多种应用场景,面对字符数据写回可持久化存储时数据量大的问题,优化后的Trie树索引结构利用字符串间的共享前缀特点,对写回可持久化设备的数据进行压缩,在节省存储空间的同时,也加快了数据写回的速度。

    一种读优化的内存数据库Trie树索引方法

    公开(公告)号:CN105117417A

    公开(公告)日:2015-12-02

    申请号:CN201510459589.6

    申请日:2015-07-30

    CPC classification number: G06F17/30961

    Abstract: 一种读优化的内存数据库Trie树索引方法,对于字符型数据,提供了O(1)的写入和查询时间复杂度,优化后的Trie树结构通过动态的分配前缀节点,减少了索引结构所占用的内存空间,通过使用节点内部的排序链表,完成范围查询操作,对list和set数据类型的支持扩展了数据库的数据格式,使数据库能有效的应对多种应用场景,面对字符数据写回可持久化存储时数据量大的问题,优化后的Trie树索引结构利用字符串间的共享前缀特点,对写回可持久化设备的数据进行压缩,在节省存储空间的同时,也加快了数据写回的速度。

    一种优化的SSD数据更新方法

    公开(公告)号:CN105117415A

    公开(公告)日:2015-12-02

    申请号:CN201510458844.5

    申请日:2015-07-30

    CPC classification number: G06F17/30327 G06F17/30218 G06F17/30371

    Abstract: 一种优化的SSD数据更新方法,针对SSD上存储的字符类型的数据,结合使用线段树和B树两种数据结构,在保证查询效率的同时,减少索引结构所占空间,在对字符数据进行更新时,利用集合交并运算特点,将两个数据块中相同key的不同value进行更新,其他数据则原样写回,通过采用基于线段B树的LSM方法,将对于SSD上字符数据的随机更新转化为数据的顺序写入,有效避免了SSD的写入放大问题,加快了SSD的写入数据速度,提高了数据库操作效率。

    一种读优化的内存数据库T树索引结构的方法

    公开(公告)号:CN103902693B

    公开(公告)日:2017-06-20

    申请号:CN201410122539.4

    申请日:2014-03-28

    Abstract: 一种读优化的内存数据库T树索引结构的方法,构造t‑T树的数据结构:根据已有的数据,建立T树索引结构,根据T树结构中节点的大小N,对数据进行插入操作,并且保证节点内的数据有序,如果一个节点内的数据满,还要进行分裂操作以保证树的平衡,在构造t‑T树过程中,树结构中的内置T树左右子树字段在这一阶段不进行任何操作;在已经建立好的t‑T树中进行数据查询操作,查询操作分为单值查询和范围查询,本发明充分利用了T树结构本身所提供的高效数据访问效率,从而在整体上提供了良好的读性能;同时,利用缓存位置敏感算法,通过减少指针的使用来提高缓存的命中率。

    一种高效的NAND闪存数据库系统的缓存管理方法

    公开(公告)号:CN103984736B

    公开(公告)日:2017-04-12

    申请号:CN201410216063.0

    申请日:2014-05-21

    Abstract: 一种高效的NAND闪存数据库系统的缓存管理方法,数据库缓冲区由三个链表管理,三个链表都是根据最近最少使用原则来组织存储数据对应的逻辑页号,三个链表分别为冷干净队列链表LCC、冷脏页队列链表LDC、混合队列链表LM,当CPU处理数据库系统上的数据I/O操作请求时,首先检查此数据是否在数据库缓冲区中,如果数据在缓冲区中命中,则将该数据在对应的队列链表上的节点调整到混合队列链表LM的头部MRU,设置它的有效冷热标识位为热标识;然后检查混合链表LM长度是否已经超过预定的阈值,启动相应操作;如果数据未在缓冲区命中,则检查缓冲区是否有空余位置,本发明能够获得较高的命中率,以及整体的存储系统性能,特别适用于对实时性要求较高的场景。

    一种HDFS中数据块的副本管理策略

    公开(公告)号:CN103425756A

    公开(公告)日:2013-12-04

    申请号:CN201310330292.0

    申请日:2013-07-31

    Abstract: 一种HDFS中数据块的副本管理策略,包括副本的启动时机的选择方法,副本个数的选择方法,副本位置的选择方法,以及新增副本的放置方法,副本的启动时机的选择方法是先确定启动周期,把一天当做一个访问周期来进行副本策略的启动,然后确定启动时刻;副本个数的选择方法是采用泊松分布来计算副本的个数,然后基于排队论的副本个数计算方法计算;副本位置的选择方法采用的副本放置策略在机架和节点的选择上,需要考虑节点的利用情况;新增副本的放置方法,新增副本位置选择在用户访问最多的节点所在机架中,在该机架中选择负载最轻的节点进行副本的创建,本发明提出了HDFS先副本策略,可以减少用户在访问HDFS数据时候的等待时间,提高系统吞吐量。

    一种优化的SSD数据更新方法

    公开(公告)号:CN105117415B

    公开(公告)日:2018-07-03

    申请号:CN201510458844.5

    申请日:2015-07-30

    Abstract: 一种优化的SSD数据更新方法,针对SSD上存储的字符类型的数据,结合使用线段树和B树两种数据结构,在保证查询效率的同时,减少索引结构所占空间,在对字符数据进行更新时,利用集合交并运算特点,将两个数据块中相同key的不同value进行更新,其他数据则原样写回,通过采用基于线段B树的LSM方法,将对于SSD上字符数据的随机更新转化为数据的顺序写入,有效避免了SSD的写入放大问题,加快了SSD的写入数据速度,提高了数据库操作效率。

    一种HDFS中数据块的副本管理策略

    公开(公告)号:CN103425756B

    公开(公告)日:2016-06-29

    申请号:CN201310330292.0

    申请日:2013-07-31

    Abstract: 一种HDFS中数据块的副本管理策略,包括副本的启动时机的选择方法,副本个数的选择方法,副本位置的选择方法,以及新增副本的放置方法,副本的启动时机的选择方法是先确定启动周期,把一天当做一个访问周期来进行副本策略的启动,然后确定启动时刻;副本个数的选择方法是采用泊松分布来计算副本的个数,然后基于排队论的副本个数计算方法计算;副本位置的选择方法采用的副本放置策略在机架和节点的选择上,需要考虑节点的利用情况;新增副本的放置方法,新增副本位置选择在用户访问最多的节点所在机架中,在该机架中选择负载最轻的节点进行副本的创建,本发明提出了HDFS先副本策略,可以减少用户在访问HDFS数据时候的等待时间,提高系统吞吐量。

    一种高效的NAND闪存数据库系统的缓存管理方法

    公开(公告)号:CN103984736A

    公开(公告)日:2014-08-13

    申请号:CN201410216063.0

    申请日:2014-05-21

    CPC classification number: G06F17/30339 G06F17/3048 G06F17/3053

    Abstract: 一种高效的NAND闪存数据库系统的缓存管理方法,数据库缓冲区由三个链表管理,三个链表都是根据最近最少使用原则来组织存储数据对应的逻辑页号,三个链表分别为冷干净队列链表LCC、冷脏页队列链表LDC、混合队列链表LM,当CPU处理数据库系统上的数据I/O操作请求时,首先检查此数据是否在数据库缓冲区中,如果数据在缓冲区中命中,则将该数据在对应的队列链表上的节点调整到混合队列链表LM的头部MRU,设置它的有效冷热标识位为热标识;然后检查混合链表LM长度是否已经超过预定的阈值,启动相应操作;如果数据未在缓冲区命中,则检查缓冲区是否有空余位置,本发明能够获得较高的命中率,以及整体的存储系统性能,特别适用于对实时性要求较高的场景。

    一种读优化的内存数据库T树索引结构的方法

    公开(公告)号:CN103902693A

    公开(公告)日:2014-07-02

    申请号:CN201410122539.4

    申请日:2014-03-28

    CPC classification number: G06F17/30327 G06F17/30442

    Abstract: 一种读优化的内存数据库T树索引结构的方法,构造t-T树的数据结构:根据已有的数据,建立T树索引结构,根据T树结构中节点的大小N,对数据进行插入操作,并且保证节点内的数据有序,如果一个节点内的数据满,还要进行分裂操作以保证树的平衡,在构造t-T树过程中,树结构中的内置T树左右子树字段在这一阶段不进行任何操作;在已经建立好的t-T树中进行数据查询操作,查询操作分为单值查询和范围查询,本发明充分利用了T树结构本身所提供的高效数据访问效率,从而在整体上提供了良好的读性能;同时,利用缓存位置敏感算法,通过减少指针的使用来提高缓存的命中率。

Patent Agency Ranking