-
公开(公告)号:CN107247873B
公开(公告)日:2020-04-14
申请号:CN201710419211.2
申请日:2017-06-06
Applicant: 电子科技大学
Abstract: 本发明公开了一种差异甲基化位点识别方法,通过分类的思想将差异甲基化位点识别转换为一种通过特征选择方法寻找对分类有重要贡献的位点,即差异甲基化位点。具体来说,首先对从公共数据库获取到的450K甲基化芯片数据进行数据预处理,包括标准化数据消除组内误差、去除批次效应消除组间误差、去掉方差较小的位点;其次,通过构建随机森林模型得到每个位点对分类的贡献值;最后,若位点贡献值大于0,则认为该位点为差异甲基化位点。通过这种方法得到的差异甲基化位点能够具有更好的类别判定性能,为癌症诊断提供更精确结果。
-
公开(公告)号:CN107247873A
公开(公告)日:2017-10-13
申请号:CN201710419211.2
申请日:2017-06-06
Applicant: 电子科技大学
IPC: G06F19/00
Abstract: 本发明公开了一种差异甲基化位点识别方法,通过分类的思想将差异甲基化位点识别转换为一种通过特征选择方法寻找对分类有重要贡献的位点,即差异甲基化位点。具体来说,首先对从公共数据库获取到的450K甲基化芯片数据进行数据预处理,包括标准化数据消除组内误差、去除批次效应消除组间误差、去掉方差较小的位点;其次,通过构建随机森林模型得到每个位点对分类的贡献值;最后,若位点贡献值大于0,则认为该位点为差异甲基化位点。通过这种方法得到的差异甲基化位点能够具有更好的类别判定性能,为癌症诊断提供更精确结果。
-