发明公开
- 专利标题: 基于数值特征表达的基因组二四代融合组装方法及系统
-
申请号: CN202211336402.X申请日: 2022-10-28
-
公开(公告)号: CN115527612A公开(公告)日: 2022-12-27
- 发明人: 李国良 , 张也 , 陆嘉华 , 彭德华 , 陈建邦 , 江熠 , 陈星霖 , 唐善雯 , 张芷硕 , 吴蕾
- 申请人: 天津大学四川创新研究院
- 申请人地址: 四川省成都市天府新经济产业园B6号楼13层
- 专利权人: 天津大学四川创新研究院
- 当前专利权人: 天津大学四川创新研究院
- 当前专利权人地址: 四川省成都市天府新经济产业园B6号楼13层
- 代理机构: 成都金英专利代理事务所
- 代理商 郭肖凌
- 主分类号: G16B30/20
- IPC分类号: G16B30/20 ; G16B40/00 ; G16B20/20 ; G06K9/62
摘要:
本发明公开了基于数值特征表达的基因组二四代融合组装方法及系统,该方法包括如下步骤:S1:读入测序文件,进行基因解析获得测序序列reads的自定义编号和碱基序列;S2:截取测序序列reads的碱基序列,获得质心特征值,并生成二代测序数据特征值矩阵和四代测序数据特征值矩阵;S3:按照设定误差阈值A搜索四代测序数据之间相似特征值对应的序列,将四代测序数据组装为基因序列骨架;S4:按照设定误差阈值B搜索二代测序数据和四代测序数据相似特征值对应的序列,将二代测序数据回帖至基因序列骨架;S5:输出最终组装结果和SNP信息表。本发明可提高涉及二四代组装和有参映射组装分析的生物信息学分析流程的速度。
公开/授权文献
- CN115527612B 基于数值特征表达的基因组二四代融合组装方法及系统 公开/授权日:2023-11-14