一种针对基因数据的取样字典树索引的压缩方法和系统

    公开(公告)号:CN109450452A

    公开(公告)日:2019-03-08

    申请号:CN201811427459.4

    申请日:2018-11-27

    Abstract: 本发明涉及一种针对基因数据的取样字典树索引的压缩方法和系统,包括:用户上传待压缩的基因数据,该基因数据包括:标识、序列和质量分值;提取该序列中预设长度的子串到字典树索引结构中进行查找,若该字典树索引结构中具有该子串,则将该子串压缩为该子串在该字典树索引结构中的位置、长度,作为该子串的索引值,否则将该子串加入该字典树索引结构,记录该子串在该字典树索引结构中的位置、长度作为该子串的索引值。本发明提高了序列的压缩效果,并使用取样索引和根据质量分值高低决定是否加入到索引结构的策略来降低字典树的内存占用空间。

    基于副本数据日志的纠删码更新方法及系统

    公开(公告)号:CN110262922B

    公开(公告)日:2021-02-09

    申请号:CN201910403522.9

    申请日:2019-05-15

    Abstract: 本发明涉及一种基于副本数据日志的纠删码更新方法,包括:接收更新数据,并将其保存至数据端的副本数据日志;当该副本数据日志满时,以该更新数据和该数据块获得校验差值,以该校验差值更新对应的数据块,并将该校验差值转发至存储校验块的校验端;将该校验差值保存至该校验端的校验日志,当该校验日志满时,通过该校验差值生成校验数据,以该校验数据更新校验块。本发明提出的纠删码更新方法,在保证一致性的前提下,减少更新过程中产生的计算开销、网络开销和磁盘寻道开销,提高了纠删码的更新效率,在一些应用场景相对其他更新方法,达到1个数量级的性能提升。

    一种DNA活字印刷机、基于DNA的数据存储设备和方法

    公开(公告)号:CN111680797A

    公开(公告)日:2020-09-18

    申请号:CN202010381206.9

    申请日:2020-05-08

    Abstract: 本发明实施例提供了一种DNA活字印刷机、基于DNA的数据存储设备和方法,所述DNA活字印刷机包括:PCR反应区,用于通过PCR反应将获取的多种DNA活字序列按序连接为表示二进制信息的DNA序列,其中,每种DNA活字序列是根据预定的映射规则预先合成的单链DNA片段,所述预定的映射规则用于定义特定的多位二进制码与特定的碱基序列之间的映射关系,每个单链DNA片段中包含与某个特定的多位二进制码对应的碱基序列;PCR产物纯化区,用于对经过PCR反应的产物进行纯化;机械臂;以及机械臂控制模块,用于控制所述机械臂以获取所述DNA活字序列,以及控制所述机械臂作为PCR反应区的产物和PCR产物纯化区的产物的转移工具,本发明能够提供高效和高性价比的DNA存储。

    一种针对基因数据的取样字典树索引的压缩方法和系统

    公开(公告)号:CN109450452B

    公开(公告)日:2020-07-10

    申请号:CN201811427459.4

    申请日:2018-11-27

    Abstract: 本发明涉及一种针对基因数据的取样字典树索引的压缩方法和系统,包括:用户上传待压缩的基因数据,该基因数据包括:标识、序列和质量分值;提取该序列中预设长度的子串到字典树索引结构中进行查找,若该字典树索引结构中具有该子串,则将该子串压缩为该子串在该字典树索引结构中的位置、长度,作为该子串的索引值,否则将该子串加入该字典树索引结构,记录该子串在该字典树索引结构中的位置、长度作为该子串的索引值。本发明提高了序列的压缩效果,并使用取样索引和根据质量分值高低决定是否加入到索引结构的策略来降低字典树的内存占用空间。

    一种DNA活字印刷机、基于DNA的数据存储设备和方法

    公开(公告)号:CN111680797B

    公开(公告)日:2023-06-06

    申请号:CN202010381206.9

    申请日:2020-05-08

    Abstract: 本发明实施例提供了一种DNA活字印刷机、基于DNA的数据存储设备和方法,所述DNA活字印刷机包括:PCR反应区,用于通过PCR反应将获取的多种DNA活字序列按序连接为表示二进制信息的DNA序列,其中,每种DNA活字序列是根据预定的映射规则预先合成的单链DNA片段,所述预定的映射规则用于定义特定的多位二进制码与特定的碱基序列之间的映射关系,每个单链DNA片段中包含与某个特定的多位二进制码对应的碱基序列;PCR产物纯化区,用于对经过PCR反应的产物进行纯化;机械臂;以及机械臂控制模块,用于控制所述机械臂以获取所述DNA活字序列,以及控制所述机械臂作为PCR反应区的产物和PCR产物纯化区的产物的转移工具,本发明能够提供高效和高性价比的DNA存储。

    基于副本数据日志的纠删码更新方法及系统

    公开(公告)号:CN110262922A

    公开(公告)日:2019-09-20

    申请号:CN201910403522.9

    申请日:2019-05-15

    Abstract: 本发明涉及一种基于副本数据日志的纠删码更新方法,包括:接收更新数据,并将其保存至数据端的副本数据日志;当该副本数据日志满时,以该更新数据和该数据块获得校验差值,以该校验差值更新对应的数据块,并将该校验差值转发至存储校验块的校验端;将该校验差值保存至该校验端的校验日志,当该校验日志满时,通过该校验差值生成校验数据,以该校验数据更新校验块。本发明提出的纠删码更新方法,在保证一致性的前提下,减少更新过程中产生的计算开销、网络开销和磁盘寻道开销,提高了纠删码的更新效率,在一些应用场景相对其他更新方法,达到1个数量级的性能提升。

Patent Agency Ranking