一种利用宏基因组分析土壤生物复合污染的方法

    公开(公告)号:CN114783519B

    公开(公告)日:2025-03-25

    申请号:CN202210596596.0

    申请日:2022-05-30

    Abstract: 本发明公开了一种利用宏基因组分析土壤生物复合污染的方法,其主要包括:(1)构建基因集与蛋白质集;(2)蛋白质集比对SARG数据库后抽取比对上的序列构建ARGs物种溯源库用于耐药基因溯源分析;(3)基因集构建个性化物种数据库,用于宏基因组微生物丰度计算;(4)收集致病菌物种信息构建致病菌物种数据库,获取样本中致病菌丰度(5)计算生物复合污染指数。本发明本发明实现了耐药基因溯源,可以轻松追踪致病菌携带的耐药基因的情况,同时还重新整合了公共数据库中的致病菌物种并构建致病菌数据库用于分析结果中致病菌信息提取,提出新型的土壤生物复合污染计算方法,为复合污染量化计算提供参考依据。

    一种使用序列k-mer频率优化特征精准识别土壤致病菌污染的方法

    公开(公告)号:CN114842908A

    公开(公告)日:2022-08-02

    申请号:CN202210294418.2

    申请日:2022-03-24

    Abstract: 本发明公开了一种使用序列k‑mer频率优化特征精准识别土壤致病菌污染的方法,其步骤为:步骤一、选取合适的k‑mer片段长度,进行频率特征提取;步骤二、对提取的数据进行归一化处理;步骤三、构建交叉融合神经网络;网络由输入层、残差网络、深度网络、交叉网络和特征合并层组成;步骤四、模型预测;第一次使用先训练神经网络参数,再将待预测细菌DNA序列通过步骤一方法提取频率特征,送入训练好的残差神经网络,输出预测结果。本发明准确率优于现有k‑mer特征预测算法;自动地将k‑mer特征组合在一起,高效学习低维特征交叉和高维非线性特征,生成更优的模型。模型不需要人工特征工程或遍历搜索,具有较低的计算成本。

    一种利用宏基因组分析土壤生物复合污染的方法

    公开(公告)号:CN114783519A

    公开(公告)日:2022-07-22

    申请号:CN202210596596.0

    申请日:2022-05-30

    Abstract: 本发明公开了一种利用宏基因组分析土壤生物复合污染的方法,其主要包括:(1)构建基因集与蛋白质集;(2)蛋白质集比对SARG数据库后抽取比对上的序列构建ARGs物种溯源库用于耐药基因溯源分析;(3)基因集构建个性化物种数据库,用于宏基因组微生物丰度计算;(4)收集致病菌物种信息构建致病菌物种数据库,获取样本中致病菌丰度(5)计算生物复合污染指数。本发明本发明实现了耐药基因溯源,可以轻松追踪致病菌携带的耐药基因的情况,同时还重新整合了公共数据库中的致病菌物种并构建致病菌数据库用于分析结果中致病菌信息提取,提出新型的土壤生物复合污染计算方法,为复合污染量化计算提供参考依据。

    一种利用宏基因组分析溯源土壤耐药基因污染的方法

    公开(公告)号:CN114822697A

    公开(公告)日:2022-07-29

    申请号:CN202210310443.5

    申请日:2022-03-28

    Abstract: 本发明公开了一种利用宏基因组分析溯源土壤耐药基因污染的方法,其步骤为:步骤一、构建非冗余耐药基因集溯源数据库;步骤二、封装非冗余耐药基因集溯源数据库;步骤三、土壤样品DNA抽提和建库;步骤四、采用Illumina测序技术完成土壤样品的宏基因组测序;步骤五、对测序数据进行质控并去除人类基因组污染,获取质控数据;步骤六、对质控数据进行耐药基因定量分析;步骤七、不同样品的耐药基因丰度总体比较分析并可视化。本发明不仅可以用于宏基因组质控数据的ARGs物种溯源定量分析,还可以使用该数据库进行ARGs注释;对微生物基因组序列进行ARGs注释时甚至可以评估其所携带的ARGs宿主来源,为抗性基因水平基因组转移等相关研究提供了技术支撑。

    一种土壤细菌可移动遗传元件的宏基因组溯源分析方法

    公开(公告)号:CN114974410A

    公开(公告)日:2022-08-30

    申请号:CN202210596560.2

    申请日:2022-05-30

    Abstract: 本发明公开了一种土壤细菌可移动遗传元件的宏基因组溯源分析方法,其步骤为:步骤一、构建MGEs数据库;步骤二、构建非冗余蛋白质集合;步骤三、使用Reads Mapping的方法对非冗余蛋白质集合进行MGEs信息注释,获取MGEs物种溯源信息;步骤四、通过筛选并去除冗余后构建MGEs物种溯源数据库;步骤五、对MGEs物种溯源数据库封装,搭建分析平台;步骤六、采集环境样品进行DNA抽提建库,用Illumina测序技术进行宏基因组测序分析,获取原始数据;步骤七、原始数据使用FastQC进行质控并去除人类基因组污染,获取质控数据Cleandata;步骤八、质控数据输入分析平台,获取MGEs物种溯源丰度表。本发明大大提高了MGEs分析的速度以及准确性,实现了基于宏基因组测序数据进行MGEs物种溯源的快速分析。

Patent Agency Ranking