基于深度学习的ENSO预报方法

    公开(公告)号:CN112488382A

    公开(公告)日:2021-03-12

    申请号:CN202011357905.6

    申请日:2020-11-27

    Applicant: 清华大学

    Abstract: 本发明提供的一种基于深度学习的ENSO预报方法,包括:从不同途径获取若干物理要素数据观测集;对物理要素数据观测集进行处理,使得全部的物理要素数据观测集的数据格式相同;对物理要素数据观测集中的若干种物理要素场进行预提取得到训练特征;通过深度学习算法,将训练特征中的各个要素物理量导入模型中进行训练得到预报模型;将实时观测数据导入预报模型中得到预报结果。本发明提供的基于深度学习的ENSO预报方法结合深度学习的方式最大程度上挖掘潜藏在大量数据中的有效信息,有效解决了现有技术中ENSO预报偏差较大的问题,从而实现更加准确的预报,提升预报精度。

    数据并行压缩方法
    22.
    发明授权

    公开(公告)号:CN103326730B

    公开(公告)日:2016-05-18

    申请号:CN201310223858.X

    申请日:2013-06-06

    Applicant: 清华大学

    Abstract: 一种数据并行压缩方法,该方法包括读取步骤,通过并行I/O从存储装置中读取待压缩数据;切分步骤,将待压缩数据均匀切分成N个数据块,并将所述N个数据块保存至每个数据块所对应的输入缓冲区;压缩编码步骤,每个进程控制对应的输入缓冲区中的数据块,并利用多线程的方法对该数据块进行并行压缩编码,将压缩编码后的数据存入输出缓冲区;写入步骤,合并输出缓冲区中各个进程并行压缩编码后的数据,并将所述合并后的数据写入输出文件中。该方法在取得理想的压缩比的同时,大大降低压缩过程对时间的开销,能够很好的应用于云存储或数据库系统中,解决压缩实时性不高的问题,提高了压缩的整体性能。

    基于选择性扫描的文件系统的元数据抽取方法及装置

    公开(公告)号:CN102110156A

    公开(公告)日:2011-06-29

    申请号:CN201110042837.9

    申请日:2011-02-22

    Applicant: 清华大学

    Abstract: 本发明提出一种基于选择性扫描的文件系统的元数据抽取方法及装置,该方法包括以下步骤:A.定义目录分组模式;B.根据扫描策略加载目录组;C.对目录排序并扫描;D.判断是否扫描完成,如果否则选择要扫描的目录并初始化其子对象元数据列表;E.判断是否扫描完成,如果否则读取下一个子对象元数据并加入子对象元数据列表中,更新时间局部性目录组;F.否则更新时间戳方差目录组;和G.判断当前扫描是否为基础扫描,如果是则更新当前目录的子目录数组并转至步骤D,否则直接转至步骤D。应用本发明实施例的元数据抽取方法,极大的提高了抽取效率。另外,本发明设计简单,易于实现。

    一种离群点检测模型训练、离群点检测方法及装置

    公开(公告)号:CN115392404B

    公开(公告)日:2023-03-24

    申请号:CN202211322273.9

    申请日:2022-10-27

    Applicant: 清华大学

    Inventor: 陈琼 黄小猛

    Abstract: 本发明提供了一种离群点检测模型训练、离群点检测方法及装置,离群点检测模型训练方法包括:获取初始数据集,初始数据集的每条数据中包含有条件属性信息和决策属性信息;分别计算各条件属性信息相对于决策属性信息的邻域近似精度,根据邻域近似度将条件属性信息分为初始第一条件属性集和初始第二条件属性集;将初始第二条件属性集中的条件属性信息依次加入初始第一条件属性集中更新初始第一条件属性集,根据更新后的第一条件属性集相对于决策属性的邻域近似精度和邻域条件熵确定约减属性集;根据约减属性集以及决策属性信息确定训练数据集;通过训练数据集对神经网络模型进行训练,得到离群点检测模型。通过本发明能够快速且准确地检测离群点。

    一种离群点检测模型训练、离群点检测方法及装置

    公开(公告)号:CN115392404A

    公开(公告)日:2022-11-25

    申请号:CN202211322273.9

    申请日:2022-10-27

    Applicant: 清华大学

    Inventor: 陈琼 黄小猛

    Abstract: 本发明提供了一种离群点检测模型训练、离群点检测方法及装置,离群点检测模型训练方法包括:获取初始数据集,初始数据集的每条数据中包含有条件属性信息和决策属性信息;分别计算各条件属性信息相对于决策属性信息的邻域近似精度,根据邻域近似度将条件属性信息分为初始第一条件属性集和初始第二条件属性集;将初始第二条件属性集中的条件属性信息依次加入初始第一条件属性集中更新初始第一条件属性集,根据更新后的第一条件属性集相对于决策属性的邻域近似精度和邻域条件熵确定约减属性集;根据约减属性集以及决策属性信息确定训练数据集;通过训练数据集对神经网络模型进行训练,得到离群点检测模型。通过本发明能够快速且准确地检测离群点。

    基于机器学习的近地面环境要素预测模型训练和预测方法

    公开(公告)号:CN113191536A

    公开(公告)日:2021-07-30

    申请号:CN202110402502.7

    申请日:2021-04-14

    Applicant: 清华大学

    Abstract: 本发明实施例提供了一种近地面环境要素的预测模型的训练方法、和预测方法,训练包括:获取第一地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据;获取第一地区的近地面环境要素的监测值;生成训练样本,其中,训练样本中以遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据中的至少部分数据作为模型输入数据,以近地面环境要素的监测值作为标签值;使用训练样本训练近地面环境要素预测模型。

    用于模式开发的并行求解方法和系统

    公开(公告)号:CN109542406B

    公开(公告)日:2020-07-17

    申请号:CN201811305089.7

    申请日:2018-11-05

    Applicant: 清华大学

    Abstract: 本发明对于模式方程提供了高效的并行数值求解方法和系统,将与待求解的模式方程对应的离散形式的表达式,该表达式的操作数为以三维数组形式表示的物理量,该表达式的运算符包括预定义的模式运算符和被重载为支持三维数组的基本运算符;根据可用的并行进程数量和三维数组的维度来划分每个物理量对应的三维数组,并保存每个三维数组在各进程间的数据分布信息;构建与所述表达式对应的表达式图,并基于该表达式图对表达式进行求解计算。该并行求解方法使用户从模式公式快速构建出并行代码,屏蔽复杂且繁琐的并行程序设计细节,简化了模式程序开发的难度。

    面向海量数据的分布式处理方法

    公开(公告)号:CN102521367B

    公开(公告)日:2013-09-04

    申请号:CN201110424530.5

    申请日:2011-12-16

    Applicant: 清华大学

    Abstract: 本发明涉及海量数据的分布式处理技术领域,公开了一种面向海量数据的分布式处理方法,包括以下步骤:S1:根据SQL命令以及数组文件内的变量信息计算输出变量和条件变量集合中的主变量,如果主变量存在,执行S2;S2:判断是否进行条件变量的选择优化;S3:判断数组是否合并存储;S4:SQL引擎根据SQL命令以及表中定义的各列的数据类型生成MapReduce任务接收到的数据元组,并生成结果数据元组;S5:对于生成的结果数据元组,判断是否需要将其以数组文件存储。本发明设计了一种基于MapReduce的、对于以数组形式存储的海量数据的分布式处理方法,使得用户可以使用SQL命令对以数组形式存储的海量数据进行分布式处理,该方法具有使用简单、运行高效,可容错的特点。

    基于键值key-value存储的分布式文件系统元数据管理方法

    公开(公告)号:CN102110146A

    公开(公告)日:2011-06-29

    申请号:CN201110039269.7

    申请日:2011-02-16

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于键值key-value存储的分布式文件系统元数据管理方法,主要涉及文件系统领域。该方法包括以下步骤:服务器存储文件和目录的元数据,并以位图的方式存储目录的子对象;对子对象的元数据进行修改操作;后台进程定期扫描所述操作日志,对超时操作进行垃圾回收。本发明的基于键值key-value存储的分布式文件系统元数据存储管理方法,具有比传统分布式文件系统更好的扩展性。同时,其采用日志记录和垃圾回收的管理模式,在对元数据修改过程中,保持了元数据的一致性。

    一种海量对象的存储系统及其运行方法

    公开(公告)号:CN102073742A

    公开(公告)日:2011-05-25

    申请号:CN201110034095.5

    申请日:2011-01-31

    Applicant: 清华大学

    Abstract: 本发明提供了一种海量对象的存储系统及其运行方法,所述系统包括:接口层单元,包括接口模块,用于构造请求信息;AXIS2请求解析引擎,用于对请求信息进行解析并将请求信息转发给服务层单元;服务层单元包括:对象服务模块,用于对对象进行管理、控制操作;容器服务模块,用于对容器进行管理、控制操作;系统管理模块,用于对存储系统进行系统管理;安全管理模块,用于对存储系统进行安全性管理;存储接口适配层模块,用于通过采用统一的接口函数访问存储层单元的存储资源;存储层单元,用于在存储资源上存储数据。本发明能够对海量的对象和容器进行简洁高效的管理,并保证系统的简洁性、灵活性、低成本的可扩展性、安全性和向后兼容性。

Patent Agency Ranking