-
公开(公告)号:CN108537003B
公开(公告)日:2020-04-07
申请号:CN201810293444.7
申请日:2018-03-30
Applicant: 大连理工大学
Abstract: 本发明属于生物数据分析技术领域,涉及一种基于单变量和对变量的标志物筛选方法。生物数据具有维度高、样本量小的特点,所以利用简单且准确的决策规则评价、选择变量,从而进行分类与预测是生物数据分析的重要任务。为综合评价变量,本发明使用信息增益计算单变量的最佳分裂点。利用最佳分裂点构造新的变量,与其对应的原始变量建立对变量。同时,原始空间的变量也通过两两组合生成变量对。然后,根据两个评分准则对所有的对变量进行评分,将其按照得分由大到小排序,选择得分最高且不重叠的k对变量,构造融合分类器。该方法的核心技术利用单变量构造新的对变量,可以使用相同的准则评估单变量与对变量的分类性能,提供切实有效的数据处理方法。
-
公开(公告)号:CN108537003A
公开(公告)日:2018-09-14
申请号:CN201810293444.7
申请日:2018-03-30
Applicant: 大连理工大学
Abstract: 本发明属于生物数据分析技术领域,涉及一种基于单变量和对变量的标志物筛选方法。生物数据具有维度高、样本量小的特点,所以利用简单且准确的决策规则评价、选择变量,从而进行分类与预测是生物数据分析的重要任务。为综合评价变量,本发明使用信息增益计算单变量的最佳分裂点。利用最佳分裂点构造新的变量,与其对应的原始变量建立对变量。同时,原始空间的变量也通过两两组合生成变量对。然后,根据两个评分准则对所有的对变量进行评分,将其按照得分由大到小排序,选择得分最高且不重叠的k对变量,构造融合分类器。该方法的核心技术利用单变量构造新的对变量,可以使用相同的准则评估单变量与对变量的分类性能,提供切实有效的数据处理方法。
-