一种基于三代测序技术的宏基因组测序数据的自动化分析方法

    公开(公告)号:CN112133368B

    公开(公告)日:2024-02-23

    申请号:CN202011090802.8

    申请日:2020-10-13

    Applicant: 南开大学

    Inventor: 刘健 田妹 陈娇

    Abstract: 本发明公开了一种基于三代测序技术的宏基因组测序数据自动化分析方法,包括以下步骤:1)原始三代测序数据进行质量控制,得到clean reads;2)对clean reads拼接组装得到contigs序列;3)对contigs进行纠错优化;4)对优化后的contigs进行物种注释;5)基于物种丰度矩阵对样本多样性进行统计分析;6)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;7)对优化后的contigs进行分箱;8)对分箱得到的bins进行基因注释;9)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;10)基于基因注释结果,完成功能注释以及物种注释;本发明提供了从三代宏基因组测序数据处理到物种组成分析、基因组成分析与功能注释的分析方法,解决了宏基因组数据自动化精准分析难题。

    基于配对的单细胞多组学数据整合方法及系统

    公开(公告)号:CN116629123A

    公开(公告)日:2023-08-22

    申请号:CN202310601945.8

    申请日:2023-05-25

    Applicant: 南开大学

    Inventor: 刘健 闫乘玮 陈娇

    Abstract: 本发明属于单细胞多组学分析领域,提供了一种基于配对的单细胞多组学数据整合方法及系统,包括获取配对的单细胞多组学数据并进行预处理,得到不同组学的表达矩阵;基于不同组学的表达矩阵,利用预先训练好的伪孪生神经网络模型将不同组学的表达矩阵嵌入在同一维度空间下进行数据整合,得到整合后的单细胞多组学数据;在训练阶段基于不同组学的表达矩阵,利用不同的变分自编码器生成不同的细胞表达矩阵,该数据将有助于得到更好的预先训练好的孪生神经网络模型。本发明进行配对细胞联合嵌入时,消除了不同批次数据的批次效应问题,且保护了大量生物学信息,使得在低纬空间下的细胞类型分布更加明显,并保持了高水平的细胞对齐关系。

    整合单细胞转录组与空间转录组数据的分析方法及系统

    公开(公告)号:CN114944193A

    公开(公告)日:2022-08-26

    申请号:CN202210552093.3

    申请日:2022-05-20

    Applicant: 南开大学

    Inventor: 刘健 阮志涵 陈娇

    Abstract: 本发明提出了整合单细胞转录组与空间转录组数据的分析方法及系统,包括:获取空间转录组数据,对空间转录组数据进行预处理;通过聚类方法将空间转录组数据中的采样点划分为若干个类别,每一个类别表示组织切片图像中一个组织区域;根据去污染后的空间基因表达数据,和空间聚类步骤的结果,筛选出在空间中具有差异性表达的基因;根据输入的单细胞数据进行分析,基于筛选出在空间中具有差异性表达的基因得出每个细胞亚群的表达模式;根据单细胞数据集中的细胞亚群表达模式,将所有spot的基因表达作为输入,获得细胞类型在各个组织区域中的分布。

    面向非标准化单细胞转录组测序数据的聚类方法及系统

    公开(公告)号:CN113257365B

    公开(公告)日:2022-07-12

    申请号:CN202110579883.6

    申请日:2021-05-26

    Applicant: 南开大学

    Inventor: 刘健 潘逸辰 陈娇

    Abstract: 本公开提供了一种面向非标准化单细胞转录组测序数据的聚类方法及系统,获取单细胞转录组测序数据;对获取的测序数据进行预处理;对预处理后的测序数据进行降维和聚类处理,得到聚类结果;将聚类结果根据Spearman相关性由小到大或由大到小排列,从Spearman相关性变化最大的间隙处删除Spearman相关性小的聚类结果;取删除处理后的各个聚类结果的等价关系矩阵平均值进行层次聚类得到最终的聚类结果;本公开在聚类融合阶段前,使得参与聚类融合的聚类结果中和其它聚类结果差距较大的异常聚类结果被剔除,从而提升了聚类融合的性能。

Patent Agency Ranking