-
公开(公告)号:CN112071366B
公开(公告)日:2024-02-27
申请号:CN202011089931.5
申请日:2020-10-13
Applicant: 南开大学
IPC: G16B25/10 , G06F18/2135
Abstract: 本发明公开了一种基于二代测序技术的宏基因组数据分析方法,包括以下步骤:1)对原始测序数据进行质量控制,得到clean reads;2)对质量控制后的clean reads进行物种注释;3)基于物种丰度矩阵对样本多样性进行统计分析;4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;5)对clean reads拼接组装得到contigs序列;6)对拼接组装得到的contigs分箱,得到bins;7)对分箱后的bins进行基因注释;8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;9)基于基因注释结果,对序列进行功能及物种注释;提供了从宏基因组二代测序数据处理到物种组成分析、基因组成分析与功能注释的全部流程,为研究人员提供准确的分析结果、全面解析宏基因组学问题。
-
公开(公告)号:CN112133368B
公开(公告)日:2024-02-23
申请号:CN202011090802.8
申请日:2020-10-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于三代测序技术的宏基因组测序数据自动化分析方法,包括以下步骤:1)原始三代测序数据进行质量控制,得到clean reads;2)对clean reads拼接组装得到contigs序列;3)对contigs进行纠错优化;4)对优化后的contigs进行物种注释;5)基于物种丰度矩阵对样本多样性进行统计分析;6)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;7)对优化后的contigs进行分箱;8)对分箱得到的bins进行基因注释;9)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;10)基于基因注释结果,完成功能注释以及物种注释;本发明提供了从三代宏基因组测序数据处理到物种组成分析、基因组成分析与功能注释的分析方法,解决了宏基因组数据自动化精准分析难题。
-
公开(公告)号:CN115798581A
公开(公告)日:2023-03-14
申请号:CN202211200712.9
申请日:2022-09-29
Applicant: 南开大学
IPC: G16B20/30 , G16B40/20 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明属于生物酶工程领域,提供了一种基于深度学习的酶改造的理性设计方法,包括构建蛋白质晶体结构数据集;基于蛋白质晶体结构数据集添加以氨基酸残基为中心的原子微环境,进行蛋白质晶体结构数据集重构;根据重构后的蛋白质晶体结构数据集,利用预先训练好的氨基酸残基预测模型对重构后的蛋白质晶体结构数据集进行氨基酸残基预测;根据预测的氨基酸残基概率与实际的天然酶的的氨基酸概率的差异程度,确定酶功能优化的潜在位点。本发明以蛋白质晶体结构数据作为基本数据集,充分利用里蛋白质的理化性质,基于人工智能对酶的进行理性设计与改造,避免了人工筛选带来的不便。
-
公开(公告)号:CN113205856A
公开(公告)日:2021-08-03
申请号:CN202110693173.6
申请日:2021-06-22
Applicant: 南开大学
Abstract: 本公开提供了一种微生物宏基因组分箱方法及系统,包括:获取待分箱的微生物宏基因组序列;对所述宏基因组序列中每条序列进行特征提取,将提取的特征输入VAE‑GAN神经网络中进行训练,通过训练将提取的特征编码到VAE隐含向量中;基于所述VAE隐含向量中的均值变量,对所述宏基因组序列进行聚类,实现宏基因组的分箱;相对于现有方法,本公开所述方案采用了多种特征融合的方式,对宏基因组的序列特征进行深度挖掘,实现了对宏基因组序列的精确描述,同时,为了提高算法的处理效率,利用VAE‑GAN神经网络对所提取的特征进行特征降维,所述降维方法在降低特征维度的同时,充分保留了序列特征中的必要成分,良好的平衡了分箱精度与分箱时间的关系。
-
公开(公告)号:CN112133368A
公开(公告)日:2020-12-25
申请号:CN202011090802.8
申请日:2020-10-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于三代测序技术的宏基因组测序数据自动化分析方法,包括以下步骤:1)原始三代测序数据进行质量控制,得到clean reads;2)对clean reads拼接组装得到contigs序列;3)对contigs进行纠错优化;4)对优化后的contigs进行物种注释;5)基于物种丰度矩阵对样本多样性进行统计分析;6)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;7)对优化后的contigs进行分箱;8)对分箱得到的bins进行基因注释;9)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;10)基于基因注释结果,完成功能注释以及物种注释;本发明提供了从三代宏基因组测序数据处理到物种组成分析、基因组成分析与功能注释的分析方法,解决了宏基因组数据自动化精准分析难题。
-
公开(公告)号:CN112071366A
公开(公告)日:2020-12-11
申请号:CN202011089931.5
申请日:2020-10-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于二代测序技术的宏基因组数据分析方法,包括以下步骤:1)对原始测序数据进行质量控制,得到clean reads;2)对质量控制后的clean reads进行物种注释;3)基于物种丰度矩阵对样本多样性进行统计分析;4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;5)对clean reads拼接组装得到contigs序列;6)对拼接组装得到的contigs分箱,得到bins;7)对分箱后的bins进行基因注释;8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;9)基于基因注释结果,对序列进行功能及物种注释;提供了从宏基因组二代测序数据处理到物种组成分析、基因组成分析与功能注释的全部流程,为研究人员提供准确的分析结果、全面解析宏基因组学问题。
-
公开(公告)号:CN113205856B
公开(公告)日:2022-07-12
申请号:CN202110693173.6
申请日:2021-06-22
Applicant: 南开大学
Abstract: 本公开提供了一种微生物宏基因组分箱方法及系统,包括:获取待分箱的微生物宏基因组序列;对所述宏基因组序列中每条序列进行特征提取,将提取的特征输入VAE‑GAN神经网络中进行训练,通过训练将提取的特征编码到VAE隐含向量中;基于所述VAE隐含向量中的均值变量,对所述宏基因组序列进行聚类,实现宏基因组的分箱;相对于现有方法,本公开所述方案采用了多种特征融合的方式,对宏基因组的序列特征进行深度挖掘,实现了对宏基因组序列的精确描述,同时,为了提高算法的处理效率,利用VAE‑GAN神经网络对所提取的特征进行特征降维,所述降维方法在降低特征维度的同时,充分保留了序列特征中的必要成分,良好的平衡了分箱精度与分箱时间的关系。
-
公开(公告)号:CN113257348A
公开(公告)日:2021-08-13
申请号:CN202110578344.0
申请日:2021-05-26
Applicant: 南开大学
Abstract: 本公开提供了一种宏转录组测序数据处理方法及系统,获取宏转录组测序数据;对获取的测序数据进行过滤;对过滤后的测序数据进行组装;根据组装后的测序数据和预设基于原核生物的基因结构特征的概率预测模型,得到测序数据中原核生物的基因预测结果;对得到的测序数据基因结构预测结果添加功能注释;根据基因预测结果的基因定量结果,对添加功能注释后的注释结果进行定量处理。本公开通过对测序数据的过滤、组装、基因预测和注释,实现了宏转录组测序数据更准确和快速的处理,实现了宏转录组基因的更精准和高效注释,提高了宏转录组测序数据的后续处理效率。
-
-
-
-
-
-
-