基于决策树算法寻找病毒基因组分类决定性位点的方法

    公开(公告)号:CN116705156A

    公开(公告)日:2023-09-05

    申请号:CN202210167610.5

    申请日:2022-02-23

    IPC分类号: G16B20/30 G06F18/241

    摘要: 本发明提供了一种病毒基因组系统进化分析方法。具体地,本发明提供了一种基于决策树算法,通过确定病毒基因组分类决定性位点,对病毒基因组进行系统进化分析的方法。本发明的方法能够高效、快速地对数万条病毒基因组序列进行分析,大大提高了系统进化分析应用的广泛性。此外,本发明通过鉴定出的分类决定性位点病毒传播过程中追踪关键性位点的变异,为流行病学研究和感染性疾病的防控奠定了坚实的基础。

    基于信息熵筛选单细胞数据敏感性基因的方法

    公开(公告)号:CN114822686A

    公开(公告)日:2022-07-29

    申请号:CN202110113321.2

    申请日:2021-01-27

    IPC分类号: G16B20/20 G16B40/30 G06K9/62

    摘要: 本发明提供了一种基于信息熵筛选单细胞数据敏感性基因的方法及基于其的单细胞聚类分析方法和系统。具体地,包括:S1.接收单细胞测序数据的初次无监督聚类分析结果;S2.1根据所述无监督聚类分析结果,计算每个簇中各基因的变异系数,并将所述变异系数在簇内排名;S2.2保留在一自定义比例的簇内均具有高变异系数的基因;S2.3计算所述具有高变异系数的基因在每个簇中的平均表达量x,用于计算信息熵H(x);S2.4将某一基因的信息熵H(x)与一自定义的信息熵阈值X比较,从而得到敏感性基因筛选结果。使用本发明的方法可筛选敏感基因,从而进行单细胞测序数据的降噪,进而优化无监督聚类分析结果。