-
公开(公告)号:CN108280236A
公开(公告)日:2018-07-13
申请号:CN201810170150.5
申请日:2018-02-28
Applicant: 福州大学
Abstract: 本发明涉及一种基于LargeVis的随机森林可视化数据分析方法。训练数据集预处理;通过随机森林提取训练数据集重要特征;采用LargeVis进行降维处理;基于LargeVis的随机森林进行可视化处理。本发明提出一种基于LargeVis的随机森林可视化的数据分析方法,针对高维数据,利用随机森林训练出的特征重要性,形成新的次高维数据,再利用LargeVis降维后的数据,送入随机森林进行预测分析并形成可视化,可以提高分类精度,又可以提高可视化的时间,同时适应不同的数据。
-
公开(公告)号:CN109409434B
公开(公告)日:2021-05-18
申请号:CN201811292849.5
申请日:2018-11-01
Applicant: 福州大学
IPC: G06K9/62
Abstract: 本发明提出一种基于随机森林的肝脏疾病数据分类规则提取的方法,包括:步骤1:对肝脏疾病中不平衡或者不规则的数据进行预处理,通过SMOTE(合成少数过采样技术)获得肝脏疾病数据集;步骤2:利用随机森林模型对肝脏疾病数据集进行二进制稀疏编码,获得肝脏疾病规则集;步骤3:对肝脏疾病规则集进行弹性范数稀疏编码规则提取,获得编码肝脏疾病规则集;步骤5:进行原始数据验证,生成最终规则集。本发明提出的结合L1和L2范数的弹性范数规则提取和特征选择方法使本发明方法不仅可以选择相对较少的特征,并可以提高泛化能力,提高分类精度。本发明提出的二次规则提取与验证方法大大提升了生成规则的可信度。
-
公开(公告)号:CN108280236B
公开(公告)日:2022-03-15
申请号:CN201810170150.5
申请日:2018-02-28
Applicant: 福州大学
IPC: G06F16/26 , G06V10/40 , G06K9/62 , G06V10/764
Abstract: 本发明涉及一种基于LargeVis的随机森林可视化数据分析方法。训练数据集预处理;通过随机森林提取训练数据集重要特征;采用LargeVis进行降维处理;基于LargeVis的随机森林进行可视化处理。本发明提出一种基于LargeVis的随机森林可视化的数据分析方法,针对高维数据,利用随机森林训练出的特征重要性,形成新的次高维数据,再利用LargeVis降维后的数据,送入随机森林进行预测分析并形成可视化,可以提高分类精度,又可以提高可视化的时间,同时适应不同的数据。
-
公开(公告)号:CN109409434A
公开(公告)日:2019-03-01
申请号:CN201811292849.5
申请日:2018-11-01
Applicant: 福州大学
IPC: G06K9/62
Abstract: 本发明提出一种基于随机森林的肝脏疾病数据分类规则提取的方法,包括:步骤1:对肝脏疾病中不平衡或者不规则的数据进行预处理,通过SMOTE(合成少数过采样技术)获得肝脏疾病数据集;步骤2:利用随机森林模型对肝脏疾病数据集进行二进制稀疏编码,获得肝脏疾病规则集;步骤3:对肝脏疾病规则集进行弹性范数稀疏编码规则提取,获得编码肝脏疾病规则集;步骤5:进行原始数据验证,生成最终规则集。本发明提出的结合L1和L2范数的弹性范数规则提取和特征选择方法使本发明方法不仅可以选择相对较少的特征,并可以提高泛化能力,提高分类精度。本发明提出的二次规则提取与验证方法大大提升了生成规则的可信度。
-
-
-