一种基于二分类器的生物标志物发现方法及系统

    公开(公告)号:CN115482938A

    公开(公告)日:2022-12-16

    申请号:CN202211292442.9

    申请日:2022-10-21

    IPC分类号: G16H50/70 G06K9/62

    摘要: 本发明公开了一种基于二分类器的生物标志物发现方法及系统,应用于医学分析领域,包括:基于bagging思想,构建正负样本数据集,划分为训练集和测试集,并通过训练集训练二分类器;通过投票法计算测试集在二分类器上的分类准确率,并基于零假设和中心极限定理,以分类准确为统计量,计算分类准确率的显著性,输出符合预设阈值条件的二分类器;通过标签集置换对二分类器性能的显著性进行评估,评估待测数据是否符合预设阈值条件,以确定最终的生物学标志物。本发明不需数据样本满足正态分布,且适用于多维数据的生物标志物发现,提高了生物标志物发现的准确与适用性。