基于UDP协议的数据流快速传输方法、系统及介质

    公开(公告)号:CN111092907B

    公开(公告)日:2021-09-03

    申请号:CN201911396313.2

    申请日:2019-12-30

    IPC分类号: H04L29/06 H04L1/18 H04L12/825

    摘要: 本发明公开了一种基于UDP协议的数据流快速传输方法、系统及介质,本发明方法包括接收端每接收一个非重复数据包,记录其数据包索引并将其放入缓存,同时更新目标文件的索引位置A和C,统计TTL时间内收取的数据包数量X,且以第一周期定时扫描索引位置B、索引位置C‑X之间的索引,将该区间内未接收的包索引生成重传请求发送给发送端,将索引位置C‑X更新为新的索引位置B。本发明能在UDP协议的基础上,以最少的资源消耗,在保证数据的有效传输的同时又能动态调整进行拥塞控制,使数据能高效快速的在各种网络环境下进行传输,具有资源消耗低、数据传输速度快的优点。

    一种基因参考序列的去冗余优化方法及系统

    公开(公告)号:CN109658985B

    公开(公告)日:2020-07-17

    申请号:CN201811591686.0

    申请日:2018-12-25

    IPC分类号: G16B50/50

    摘要: 本发明公开了一种基因参考序列的去冗余优化方法及系统,针对基因参考序列,本发明通过按照指定步长遍历获取指定长度的连续参考序列Kmer,然后通过哈希桶将连续参考序列Kmer进行分散、选择性去冗余,再重新组装,从而在能够尽可能的减少参考序列Kmer的个数的同时保证连续参考序列Kmer的质量,本发明能够在保证尽量不减少压缩率的前提下减少基因参考序列的冗余度,精简出更适合的参考序列,使得优化后的基因参考序列体积更小,被用于做压缩参考索引时加载内存更快,从而提高基因数据的压缩效率。

    基于UDP协议的数据流快速传输方法、系统及介质

    公开(公告)号:CN111092907A

    公开(公告)日:2020-05-01

    申请号:CN201911396313.2

    申请日:2019-12-30

    IPC分类号: H04L29/06 H04L1/18 H04L12/825

    摘要: 本发明公开了一种基于UDP协议的数据流快速传输方法、系统及介质,本发明方法包括接收端每接收一个非重复数据包,记录其数据包索引并将其放入缓存,同时更新目标文件的索引位置A和C,统计TTL时间内收取的数据包数量X,且以第一周期定时扫描索引位置B、索引位置C-X之间的索引,将该区间内未接收的包索引生成重传请求发送给发送端,将索引位置C-X更新为新的索引位置B。本发明能在UDP协议的基础上,以最少的资源消耗,在保证数据的有效传输的同时又能动态调整进行拥塞控制,使数据能高效快速的在各种网络环境下进行传输,具有资源消耗低、数据传输速度快的优点。

    群体频率与突变预测相结合的突变致病性检测方法及系统

    公开(公告)号:CN109390038B

    公开(公告)日:2020-01-14

    申请号:CN201811591411.7

    申请日:2018-12-25

    IPC分类号: G16B20/50 G16B30/00

    摘要: 本发明公开了一种群体频率与突变预测相结合的突变致病性检测方法及系统,本发明的实施步骤包括:获取归一化后的突变预测检测结果A、群体频率检测结果B;将群体频率检测结果B通过预设的多项式拟合函数转换得到函数转换结果f(B),所述多项式拟合函数为将突变预测检测结果A作为函数值、群体频率检测结果B作为自变量进行拟合得到;将突变预测检测结果A、函数转换结果f(B)两者进行加权求和,得到群体频率与突变预测相结合的突变致病性检测结果。本发明实现了群体频率与突变预测两者的更科学地结合,能够提高突变致病性检测的准确度,具有致病性检测值准确率高、通用性好、扩展性高的优点。

    一种面向PubMed论文库的作者学科方向数据挖掘方法及系统

    公开(公告)号:CN109741791A

    公开(公告)日:2019-05-10

    申请号:CN201811638977.0

    申请日:2018-12-29

    IPC分类号: G16B50/00 G16B40/00

    摘要: 本发明公开了一种面向PubMed论文库的作者学科方向数据挖掘方法及系统,本发明实施例步骤包括初始化学科描述数组RD、作者学科计数数组AC,确定PubMed论文库中收录的目标作者的论文集合,针对目标作者的论文集合中的每一篇论文进行遍历,且每遍历一篇论文,则获取该论文的所有关键词的MESH号以及MESH树形编码,并根据MESH树形编码统计每个学科的词项计数后更新目标作者的作者学科计数数组AC,根据目标作者的作者学科计数数组AC确定目标作者的学科方向并输出;系统包括前述方法对应的系统。本发明利用PubMed论文库提供的关键词的MESH编号,能够实现作者学科方向数据挖掘,且具有运行性能高、获得研究学科方向准确的特点。

    一种基因参考序列的去冗余优化方法及系统

    公开(公告)号:CN109658985A

    公开(公告)日:2019-04-19

    申请号:CN201811591686.0

    申请日:2018-12-25

    IPC分类号: G16B50/50

    摘要: 本发明公开了一种基因参考序列的去冗余优化方法及系统,针对基因参考序列,本发明通过按照指定步长遍历获取指定长度的连续参考序列Kmer,然后通过哈希桶将连续参考序列Kmer进行分散、选择性去冗余,再重新组装,从而在能够尽可能的减少参考序列Kmer的个数的同时保证连续参考序列Kmer的质量,本发明能够在保证尽量不减少压缩率的前提下减少基因参考序列的冗余度,精简出更适合的参考序列,使得优化后的基因参考序列体积更小,被用于做压缩参考索引时加载内存更快,从而提高基因数据的压缩效率。

    群体频率与突变预测相结合的突变致病性检测方法及系统

    公开(公告)号:CN109390038A

    公开(公告)日:2019-02-26

    申请号:CN201811591411.7

    申请日:2018-12-25

    IPC分类号: G16B20/50 G16B30/00

    摘要: 本发明公开了一种群体频率与突变预测相结合的突变致病性检测方法及系统,本发明的实施步骤包括:获取归一化后的突变预测检测结果A、群体频率检测结果B;将群体频率检测结果B通过预设的多项式拟合函数转换得到函数转换结果f(B),所述多项式拟合函数为将突变预测检测结果A作为函数值、群体频率检测结果B作为自变量进行拟合得到;将突变预测检测结果A、函数转换结果f(B)两者进行加权求和,得到群体频率与突变预测相结合的突变致病性检测结果。本发明实现了群体频率与突变预测两者的更科学地结合,能够提高突变致病性检测的准确度,具有致病性检测值准确率高、通用性好、扩展性高的优点。

    一种基于对象存储的大型数据云存储方法

    公开(公告)号:CN106991134A

    公开(公告)日:2017-07-28

    申请号:CN201710146689.2

    申请日:2017-03-13

    IPC分类号: G06F17/30 G06F19/28 H04L29/08

    摘要: 本发明公开了一种基于对象存储的大型数据云存储方法,实施步骤包括:客户端读取待存储大型数据文件并形成至少一种数据子流,分别在内存中不断累积形成固定大小的数据块,一边将数据块及其描述信息压缩形成输出实例,一边将输出实例发送给云平台;云平台建立包含块容器对象的根容器对象,一边接收客户端针对待存储大型数据文件发送的输出实例,一边将接收到的输出实例作为对象保存到对应的根容器对象中,且各个数据子流的输出实例保存在一个以上块容器对象中。本发明基于分流分块并发压缩的思想,支持数据压缩及传输上云同步进行的方式、支持对不同数据子流的数据块采取极具针对性的压缩方案,能大量节约数据上传的时间成本与数据存储的经济成本。

    SAM及BAM文件CIGAR域的压缩及解压还原方法、系统和介质

    公开(公告)号:CN110708074B

    公开(公告)日:2022-12-02

    申请号:CN201910789642.7

    申请日:2019-08-26

    IPC分类号: H03M7/30

    摘要: 本发明公开了一种SAM及BAM文件CIGAR域的压缩及解压还原方法、系统和介质,本发明从压缩前的预处理出发,将一个操作符的CIGAR域数据编码为第一指定内容,跳转执行步骤A6);将两个操作符的CIGAR域数据编码为只包含其中一个操作符及其数字部分的第二指定内容,将三个及以上操作符的CIGAR域数据编码省略第一个操作符M及其数字部分“\d+M”、最后一个操作符的操作符M得到第三指定内容,结合CIGAR域的特性进行预处理,从而可将CIGAR域的内容按照一定规则预处理以实现CIGAR域的高倍压缩,具有预处理高效快速、压缩比高、压缩效果好的优点,本发明可适用于SAM文件、BAM文件两种格式,具有应用范围广的优点。