-
公开(公告)号:CN114611706B
公开(公告)日:2023-04-25
申请号:CN202210155739.4
申请日:2022-02-21
Applicant: 河南大学
Abstract: 本发明提供一种基于Stacking多模型融合设计的空气污染物缺失值补充方法。该方法包括:获取各个国控站点监测的空气污染物数据和地理数据;针对每个国控站点,遍历其上的所有空气污染物数据,找到缺失值,并将缺失值所在位置处的数值补充为0;再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集Air‑data;使用Hyperopt分别对ET、RF、GBDT、XGBOOST和LGBM进行参数优化;将上述优化后的五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于数据集Air‑data对基学习器和元学习器进行融合得到Stacking集成模型;采用Stacking集成模型实现对空气污染物数据中的缺失值的估算。
-
公开(公告)号:CN114662389B
公开(公告)日:2023-02-03
申请号:CN202210282721.0
申请日:2022-03-22
Applicant: 河南大学
IPC: G06F30/27 , G06N3/0464 , G06N3/084
Abstract: 本发明的一种面向空气污染物的自相关误差Informer模型长时序预测方法及系统,该方法包括:基于自相关误差对Informer模型进行改进,得到AE‑Informer模型;收集各站点的小时空气污染物数据并进行预处理,包括:缺失值补缺,统一编码;对AE‑Informer模型进行超参数的调节;基于处理后的各站点的小时空气污染物数据,采用近似求导反向误差传播算法训练AE‑Informer模型;对实时收集的各站点小时空气污染物数据进行预处理,之后输入训练好的AE‑Informer模型中,进行空气污染物的长时序预测。本发明在空气污染物浓度长时序预测方面取得了较高的预测精度。
-
公开(公告)号:CN114611706A
公开(公告)日:2022-06-10
申请号:CN202210155739.4
申请日:2022-02-21
Applicant: 河南大学
Abstract: 本发明提供一种基于Stacking多模型融合设计的空气污染物缺失值补充方法。该方法包括:获取各个国控站点监测的空气污染物数据和地理数据;针对每个国控站点,遍历其上的所有空气污染物数据,找到缺失值,并将缺失值所在位置处的数值补充为0;再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集Air‑data;使用Hyperopt分别对ET、RF、GBDT、XGBOOST和LGBM进行参数优化;将上述优化后的五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于数据集Air‑data对基学习器和元学习器进行融合得到Stacking集成模型;采用Stacking集成模型实现对空气污染物数据中的缺失值的估算。
-
公开(公告)号:CN113010598A
公开(公告)日:2021-06-22
申请号:CN202110467800.4
申请日:2021-04-28
Applicant: 河南大学
IPC: G06F16/26 , G06F16/29 , G06F3/0483 , G06F3/0484 , G06F21/60 , G06F40/186
Abstract: 本发明提供一种面向遥感大数据处理的动态自适应分布式协同工作流系统。该系统包括:工作流模型协同构建模块、工作流引擎模块、遥感大数据处理资源管理子系统和遥感大数据处理计算平台;工作流模型协同构建模块,用于采用协同编辑界面,由多个专家共同采用拖拽的形式进行图形化构建,自动生成遥感大数据处理过程描述语言RSBDPDL描述的遥感大数据处理工作流模型;工作流引擎模块,用于对专家共同构建的遥感大数据处理工作流模型进行解析、执行并提供分布式任务管理;遥感大数据处理资源管理子系统,用于采用层次型多Agent对遥感应用系统中所需资源进行组织和管理;遥感大数据处理计算平台,用于提供整个工作流系统分布式部署的计算环境。
-
公开(公告)号:CN112884079A
公开(公告)日:2021-06-01
申请号:CN202110338272.2
申请日:2021-03-30
Applicant: 河南大学
Abstract: 本发明属于遥感数据应用技术技术领域,涉及一种基于Stacking集成模型的近地面二氧化氮浓度估算方法,包括以下步骤:获取监测站点实际NO2浓度数据、气象监测数据、地理数据和人口数据;获取NO2对流层柱浓度卫星遥感数据并进行验证;数据清理,采用网格化方式对监测站点实际NO2浓度数据和NO2对流层柱浓度卫星遥感数据进行求均并与气象监测数据匹配,构建NO2数据集;基于NO2数据集进行建模,采用GA‑RF、GA‑GBRT和GA‑XGBoost三种模型作为基学习器,岭回归作为元学习器进行融合得到Stacking集成模型;利用Stacking集成模型对近地面NO2浓度进行模拟估算,得到近地面NO2浓度。本发明通过多种机器学习算法的结合,克服单个模型的缺陷,优化线性回归的输入,提升模型整体性能。
-
公开(公告)号:CN113010598B
公开(公告)日:2022-11-01
申请号:CN202110467800.4
申请日:2021-04-28
Applicant: 河南大学
IPC: G06F16/26 , G06F16/29 , G06F3/04845 , G06F3/0483 , G06F21/60 , G06F40/186
Abstract: 本发明提供一种面向遥感大数据处理的动态自适应分布式协同工作流系统。该系统包括:工作流模型协同构建模块、工作流引擎模块、遥感大数据处理资源管理子系统和遥感大数据处理计算平台;工作流模型协同构建模块,用于采用协同编辑界面,由多个专家共同采用拖拽的形式进行图形化构建,自动生成遥感大数据处理过程描述语言RSBDPDL描述的遥感大数据处理工作流模型;工作流引擎模块,用于对专家共同构建的遥感大数据处理工作流模型进行解析、执行并提供分布式任务管理;遥感大数据处理资源管理子系统,用于采用层次型多Agent对遥感应用系统中所需资源进行组织和管理;遥感大数据处理计算平台,用于提供整个工作流系统分布式部署的计算环境。
-
公开(公告)号:CN114662389A
公开(公告)日:2022-06-24
申请号:CN202210282721.0
申请日:2022-03-22
Applicant: 河南大学
Abstract: 本发明的一种面向空气污染物的自相关误差Informer模型长时序预测方法及系统,该方法包括:基于自相关误差对Informer模型进行改进,得到AE‑Informer模型;收集各站点的小时空气污染物数据并进行预处理,包括:缺失值补缺,统一编码;对AE‑Informer模型进行超参数的调节;基于处理后的各站点的小时空气污染物数据,采用近似求导反向误差传播算法训练AE‑Informer模型;对实时收集的各站点小时空气污染物数据进行预处理,之后输入训练好的AE‑Informer模型中,进行空气污染物的长时序预测。本发明在空气污染物浓度长时序预测方面取得了较高的预测精度。
-
-
-
-
-
-