一种基因组装的多线程化方法及系统

    公开(公告)号:CN115359842A

    公开(公告)日:2022-11-18

    申请号:CN202211034382.0

    申请日:2022-08-26

    IPC分类号: G16B30/20 G16B30/10

    摘要: 本发明公开了一种基因组装的多线程化方法及系统,该方法包括如下步骤:S1:生成ID对接表;S2:使用B+树索引分别从硬盘或虚拟内存中提取编号read ID对应的碱基序列;S3:将对接关系后的多条序列依次与基准序列匹配;S4:读取能够和基准序列匹配的下一批编号read ID的碱基序列;S5:输出线程标识和匹配合并输出后的小型重叠群small contig;S6:当ID对接表读取完毕后,遍历ID对接表,将线程标识表中零散编号read ID的碱基序列替换为相应的碱基序列ID,并输出单核苷酸变异SNP信息表。本发明通过组建服务器集群进行计算,以其中一台作为共享存储,其他服务器各自领取任务执行,实现服务器多机并行计算,组装算法的线性性能递增,无限降低计算时间。

    一种分布式边缘融合算力部署系统

    公开(公告)号:CN115981873B

    公开(公告)日:2023-05-30

    申请号:CN202310264940.0

    申请日:2023-03-20

    IPC分类号: G06F9/50 G06F9/54

    摘要: 本发明公开了一种分布式边缘融合算力部署系统,包括资源管理器、管理单元、算力单元和边缘设备,所述资源管理器用以监控和指派算力单元的运行状态,并分配和回收空闲的算力单元;所述管理单元用以监控各类设备的运行状态,调度算力和监控资源向对应设备部署和管理任务,并对外提供服务平台;所述算力单元用以根据资源管理器的指令转换工作状态,并根据管理单元指令接收任务;所述边缘设备用以控制内网设备并进行指令转译。本发明将边缘设备的算力和服务器集群算力进行统一,以便进行最佳调度,通过简单接口即可定义框架内模型并自动进行推理部署,以达到标准化部署环境的目的。

    一种基于特征向量的高性能基因匹配判别方法及系统

    公开(公告)号:CN115410651A

    公开(公告)日:2022-11-29

    申请号:CN202211034348.3

    申请日:2022-08-26

    摘要: 本发明公开了一种基于特征向量的高性能基因匹配判别方法及系统,该方法包括如下步骤:S1:CPU多线程基因解析,获得基因数据reads的ID、碱基序列和序列长度,并传回GPU;S2:GPU计算每条基因数据reads片段的质心值;S3:评价碱基序列相似性;S4:训练DNN模型:将输入向量x送至DNN网络的输入层,进行前向传播,经过若干隐层后得到前向输出y';S5:计算y'与真实值y之间的误差,并调整DNN网络的各个连接权值;S6:完成DNN模型的训练后,利用训练好的DNN模型识别基因数据reads之间的匹配关系,由此获得每条基因数据reads间的相似性关系。本发明大幅提高了生物信息学分析流程的速度,有助于生信分析人员以更快的速度、更短的时间获得准确的分析结果。

    一种分布式边缘融合算力部署系统

    公开(公告)号:CN115981873A

    公开(公告)日:2023-04-18

    申请号:CN202310264940.0

    申请日:2023-03-20

    IPC分类号: G06F9/50 G06F9/54

    摘要: 本发明公开了一种分布式边缘融合算力部署系统,包括资源管理器、管理单元、算力单元和边缘设备,所述资源管理器用以监控和指派算力单元的运行状态,并分配和回收空闲的算力单元;所述管理单元用以监控各类设备的运行状态,调度算力和监控资源向对应设备部署和管理任务,并对外提供服务平台;所述算力单元用以根据资源管理器的指令转换工作状态,并根据管理单元指令接收任务;所述边缘设备用以控制内网设备并进行指令转译。本发明将边缘设备的算力和服务器集群算力进行统一,以便进行最佳调度,通过简单接口即可定义框架内模型并自动进行推理部署,以达到标准化部署环境的目的。

    基于数值特征表达的基因组二四代融合组装方法及系统

    公开(公告)号:CN115527612A

    公开(公告)日:2022-12-27

    申请号:CN202211336402.X

    申请日:2022-10-28

    摘要: 本发明公开了基于数值特征表达的基因组二四代融合组装方法及系统,该方法包括如下步骤:S1:读入测序文件,进行基因解析获得测序序列reads的自定义编号和碱基序列;S2:截取测序序列reads的碱基序列,获得质心特征值,并生成二代测序数据特征值矩阵和四代测序数据特征值矩阵;S3:按照设定误差阈值A搜索四代测序数据之间相似特征值对应的序列,将四代测序数据组装为基因序列骨架;S4:按照设定误差阈值B搜索二代测序数据和四代测序数据相似特征值对应的序列,将二代测序数据回帖至基因序列骨架;S5:输出最终组装结果和SNP信息表。本发明可提高涉及二四代组装和有参映射组装分析的生物信息学分析流程的速度。