发明授权
CN108197434B 去除宏基因组测序数据中人源基因序列的方法
失效 - 权利终止
- 专利标题: 去除宏基因组测序数据中人源基因序列的方法
-
申请号: CN201810041369.5申请日: 2018-01-16
-
公开(公告)号: CN108197434B公开(公告)日: 2020-04-10
- 发明人: 苏政 , 肖卫民 , 苏闻 , 赵崇涛 , 黄瑞坤
- 申请人: 深圳市泰康吉音生物科技研发服务有限公司
- 申请人地址: 广东省深圳市福田区上梅林中康南路8号雕塑家园2443房
- 专利权人: 深圳市泰康吉音生物科技研发服务有限公司
- 当前专利权人: 深圳市泰康吉音生物科技研发服务有限公司
- 当前专利权人地址: 广东省深圳市福田区上梅林中康南路8号雕塑家园2443房
- 代理机构: 东莞市神州众达专利商标事务所
- 代理商 刘汉民
- 主分类号: G16B30/10
- IPC分类号: G16B30/10 ; G16B30/20
摘要:
本发明公开了一种去除宏基因组测序数据中人源基因序列的方法,该方法包括以下步骤:通过千人基因组计划样本的原始测序数据构建参考基因集,在得到千人基因组数据的高质量的测序read后,使用基因组组装软件将其组装成较长的基因片段,后续作为参考序列与测序read进行比对;提取来源于NCBI数据库中所有非肿瘤样本中的基因片段数据作为NCBI Bioproject的基因片段数据用作后续处理;将千人基因组的数据与NCBI Bioproject的数据合并,去冗余后变成非冗余的基因片段数据集;将非冗余的基因片段数据集中的的病毒基因组序列找出,从基因片段序列中去除;将病毒基因序列组去除后的基因片段序列作为去除宏基因组测序数据中人源序列的参考基因组。
公开/授权文献
- CN108197434A 去除宏基因组测序数据中人源基因序列的方法 公开/授权日:2018-06-22