一种mNGS鉴定微生物的数据处理方法、装置及存储介质

    公开(公告)号:CN114242173B

    公开(公告)日:2023-05-16

    申请号:CN202111579973.1

    申请日:2021-12-22

    IPC分类号: G16B50/00 G16B30/10

    摘要: 本申请公开了一种mNGS鉴定微生物的数据处理方法、装置及存储介质。本申请的数据处理方法包括,利用Linux系统提供的内存映射/dev/shm加载数据库;在读取数据库之前,先检查数据库大小,如小于硬盘中原始加载的数据库大小,则通过虚拟内存触碰方式将其激活,使得加载数据库完整的缓存于内存中;采用内存映射方式加载参考基因组;采用Linux管道输出和读入,减少临时文件,提高分析速度。本申请方法,通过对数据处理过程中限制速度的关键步骤进行优化,提高了mNGS鉴定微生物的速度和效率,降低了对高性能硬件设备的依赖性,使得mNGS鉴定微生物仅采用现有常规的硬件设备就能实现快速、高效、准确的微生物分析和鉴定。

    一种检测样本污染率的方法及装置

    公开(公告)号:CN115083529B

    公开(公告)日:2023-03-14

    申请号:CN202210811098.3

    申请日:2022-07-11

    IPC分类号: G16B50/30 G16B20/30

    摘要: 一种检测样本污染率的方法及装置,该方法包括:位点MAF提取步骤,包括提取待测样本的测序数据中的位点在数据库中的MAF;过滤步骤,包括过滤去除不符合条件的SNP位点;错误率计算步骤,包括计算不同碱基替换的错误率;似然值计算步骤,包括计算待测样本在不同污染率下的似然值;候选污染率计算步骤,包括根据每个SNP位点计算的似然值对数与位点深度计算加权平均值,选择加权平均值最大的似然值对应的污染率为候选污染率;优化步骤,包括根据优化函数优化候选污染率,获得最终的样本污染率。该方法的分析结果可信度高。

    一种差异性甲基化区域筛选方法及其装置

    公开(公告)号:CN114171115A

    公开(公告)日:2022-03-11

    申请号:CN202111340427.2

    申请日:2021-11-12

    IPC分类号: G16B20/00

    摘要: 一种差异性甲基化区域筛选方法及其装置,筛选方法包括:CpG簇的提取步骤;CpG簇的筛选步骤;肿瘤组织特异的差异性甲基化区域筛选步骤;肿瘤cfDNA特异的差异性甲基化区域筛选步骤,以健康样本的cfDNA测序数据和患病样本的cfDNA测序数据作为背景数据集,对高差异性甲基化区域、低差异性甲基化区域进行过滤,获得过滤后的高差异性甲基化区域、低差异性甲基化区域。本发明基于CpG位点距离与甲基化信号连锁性的高度相关性,动态地将基因组划分为具有连锁关系的CpG簇,结合数据库中的肿瘤群体数据和健康个体数据,筛选获得肿瘤cfDNA中特异的差异性甲基化区域,有效提高甲基化标记物筛选的灵敏性与特异性。