去除宏基因组测序数据中人源基因序列的方法
摘要:
本发明公开了一种去除宏基因组测序数据中人源基因序列的方法,该方法包括以下步骤:通过千人基因组计划样本的原始测序数据构建参考基因集,在得到千人基因组数据的高质量的测序read后,使用基因组组装软件将其组装成较长的基因片段,后续作为参考序列与测序read进行比对;提取来源于NCBI数据库中所有非肿瘤样本中的基因片段数据作为NCBI Bioproject的基因片段数据用作后续处理;将千人基因组的数据与NCBI Bioproject的数据合并,去冗余后变成非冗余的基因片段数据集;将非冗余的基因片段数据集中的的病毒基因组序列找出,从基因片段序列中去除;将病毒基因序列组去除后的基因片段序列作为去除宏基因组测序数据中人源序列的参考基因组。
公开/授权文献
0/0