基于组内组间优化的多重插补的乳腺癌缺失数据插补模型

    公开(公告)号:CN115116616A

    公开(公告)日:2022-09-27

    申请号:CN202210924114.X

    申请日:2022-08-02

    Abstract: 本发明是涉及基于组内组间优化的多重插补的乳腺癌缺失数据插补模型。该插补模型由组内优化插补和组间优化插补组成,将均值插补、随机森林插补、贝叶斯线性回归插补、分类回归树插补和线性回归插补五种方法作为多重插补的基础方法,并结合医学特征的参考阈值进行综合插补。得到组内最优插补数据集,最后以均方根误差作为组间最优插补的评判标准。在插补过程中,加入临床特征阈值判别有利于增强医学数据特征的结构分布,让数据更具真实性。在组内优化中考虑到不同特征间的差异以及特征缺失值的不确定性,组间优化中考虑各插补方法的横向比较,让缺失数据的插补更具稳健性。

Patent Agency Ranking