一种基于FAD和DTW的水文时间序列相似性搜索方法

    公开(公告)号:CN114911846A

    公开(公告)日:2022-08-16

    申请号:CN202210531963.9

    申请日:2022-05-17

    Applicant: 河海大学

    Abstract: 本发明公开一种基于FAD和DTW的水文时间序列相似性搜索方法,该方法包括:首先利用小波变换对预先获取的时间序列进行平滑处理;其次,选择时间序列中的起始点、终止点和局部极值点作为特征点,对相邻特征点之间的数据段赋予语义,对序列进行语义符号化表示;然后计算初步候选集中子序列以及待查询序列中每个点的导数估计值,得到导数估计序列,然后转换为符号表示序列,最后得到初步候选集中子序列和待查询序列对应的特征序列;以上数据表示阶段完成后,首先利用FAD找出趋势近似的子序列,然后利用DTW进行精确匹配,最终的相似子序列。本发明结合FAD和DTW的特点对历史时间序列进行相似性搜索,很大程度上提高了搜索效率。

    一种基于XGBoost的水文预报误差校正方法

    公开(公告)号:CN114580762A

    公开(公告)日:2022-06-03

    申请号:CN202210234577.3

    申请日:2022-03-10

    Applicant: 河海大学

    Abstract: 本发明公开一种基于XGBoost的水文预报误差校正方法,该方法包括:(1)采集一水系流域对应预报站点一定时间段内的实况水位值及水文模型预报水位值,组织成水文时间序列数据集;(2)构建误差数据集,对数据进行预处理,划分训练集和测试集并确定模型最终的输入;(3)采用SPGA优化算法对XGBoost的学习率、弱学习器个数、惩罚项系数、决策树最大深度四个参数进行优化,同时利用样本数据集对XGBoost模型进行训练,最终得到SPGA优化的XGBoost预报误差校正模型;(4)对所述SPGA优化的XGBoost水文预报误差校正模型进行测试。本发明自行组织数据集,使用XGBoost模型进行模拟误差计算,其中采用SPGA算法对XGBoost模型的参数进行优化,利用最优参数得到的模型进一步提升误差校正能力。

    基于SW_LSTM的水文时间序列预测方法

    公开(公告)号:CN113792925A

    公开(公告)日:2021-12-14

    申请号:CN202111084593.0

    申请日:2021-09-17

    Applicant: 河海大学

    Abstract: 本发明公开一种基于SW_LSTM的水文时间序列预测方法,包括对水文数据进行归一化处理;对水文时间序列数据的最优特征筛选;选取待预测水文站的水位数据作为实验数据;并将实验数据与筛选特征组合后进行预测,得到水文时间序列预测结果。本发明对数据进行归一化处理后,筛选出与水位变化特征最优特征,并将其结合SW_LSTM方法进行水文时间序列预测,使得水文时间序列预测结果更准确。

    一种融合趋势特征的时间序列符号聚集近似表示方法

    公开(公告)号:CN111143442A

    公开(公告)日:2020-05-12

    申请号:CN201911407029.0

    申请日:2019-12-31

    Applicant: 河海大学

    Abstract: 本发明公开了一种融合趋势特征的时间序列符号聚集近似表示方法;融合趋势特征的时间序列近似表示方法包括如下步骤:时间序列数据获取;时间序列数据预处理;时间序列特征分割;时间序列统计特征提取与符号化表示;时间序列的趋势特征提取与符号化表示;融合趋势特征的时间序列符号表示及相似性度量。本发明将时间序列的趋势特征信息和统计特征信息相结合,形成一种新的、能兼顾时间序列统计特征和趋势特征的符号聚集近似表示方法,在不损失序列特征信息的前提下,将时间序列从高维空间映射到低维空间。该方法不仅比传统时间序列表示方法具有更好的下界密封性,还能获得更好的分类和聚类效果,从而更好地表示具有不同形态特征的时间序列。

    一种基于洪峰参考集的中小河流流域相似性判别方法

    公开(公告)号:CN109508348A

    公开(公告)日:2019-03-22

    申请号:CN201811123838.4

    申请日:2018-09-26

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于洪峰参考集的中小河流流域相似性判别方法,首先进行洪峰分割,提取洪峰模式,即根据水位数据变化趋势找出洪峰过程分割的起止点,采用起止点之间的水位序列代表洪峰模式;然后训练洪峰参考集:依次利用极大值过滤法、最大距离方差选择和最小相关选择从洪峰模式序列集中筛选出预设数目的洪峰模式序列,作为洪峰参考集;最后利用DTW距离度量待查询流域与其他流域的洪峰参考集中洪峰模式序列之间的距离,判断时间序列相似性,得到在洪峰模式上与待查询流域相似度最高的流域。本发明通过数据挖掘实现中小流域相似性进行定量分析和判断,解决现有技术无法针对洪水特性实现流域量化分析的技术问题。

    一种基于嵌入式索引的水文时间序列相似性搜索方法

    公开(公告)号:CN105069093B

    公开(公告)日:2018-07-24

    申请号:CN201510475456.8

    申请日:2015-08-05

    Applicant: 河海大学

    CPC classification number: Y02A10/46

    Abstract: 本发明公开了一种基于嵌入式索引的水文时间序列相似性搜索方法,按如下步骤进行:离线准备阶段对原始时间序列中的每个位置,计算对应的嵌入式索引向量,离线准备阶段实现了水文时间序列洪峰分割,串行聚类,初始参考序列集生成,参考集训练和时间序列嵌入索引计算;在线搜索阶段利用查询序列和参考集序列进行索引向量的计算,在原始序列的嵌入式索引欧氏向量空间中搜索,找到比较相似的点作为候选点集合,对候选点精炼后进行原始DTW度量,找到最终的相似序列。本发明将相似性搜索映射到欧氏向量空间中进行搜索,很大程度上提高了搜索效率。

    利用相似性搜索和改进BP神经网络预测水位的方法

    公开(公告)号:CN104239489B

    公开(公告)日:2018-03-20

    申请号:CN201410454011.7

    申请日:2014-09-05

    Applicant: 河海大学

    CPC classification number: Y02A10/46

    Abstract: 本发明公开一种利用相似性搜索和改进的BP神经网络预测水位的方法,根据待预测日前十五日的水位与前五十年拥有相似水文特征月份的水位进行相似性度量,查找出其与每一年最相近的水位时间段,然后将这五十年的最相近的水位时间段以及后一日的水位作为训练集,采用基于遗传算法的BP神经网络进行预测。该方法包括数据预处理,旨在弥补数据缺失错误等;相似性搜索,利用动态弯曲距离和滑动窗口技术,找出该十五日水位与前五十年相似月份水位最小的距离即最相似序列;基于遗传算法的BP神经网络,用遗传算法建立系统层次结构进行全局寻优,并利用BP神经网络的学习训练能力进行预测。本发明能够提前预测水位,为防洪抗灾提供有效的技术支持。

    一种面向行业元数据注册和分布式检索系统及方法

    公开(公告)号:CN106528612A

    公开(公告)日:2017-03-22

    申请号:CN201610865130.0

    申请日:2016-09-29

    Applicant: 河海大学

    CPC classification number: G06F16/2471

    Abstract: 本发明公开了一种面向行业元数据注册和分布式检索系统及方法。系统包含如下三个模块:注册模块,用于实现跨数据中心行业元数据注册共享,针对不同的行业中央及地方数据中心,由该数据中心的数据管理单位实现元数据自行审核注册,并且由该单位对管理的数据分类处理,将部分用于检索的元数据注入中央节点,地方节点存放所有元数据;存储模块,数据管理单位对管理的元数据注册生成倒排索引,倒排索引分布于中央与地方节点,同时实现元数据存储与管理的分离;分布式检索模块,用于实现跨数据中心行业元数据共享,对不同数据中心的大量行业元数据进行分布式检索。本发明解决了跨数据中心行业元数据共享的难题,能够分布式处理大量的行业元数据,满足用户的检索需求。

    基于机器学习的水文曲线提取方法

    公开(公告)号:CN106203496A

    公开(公告)日:2016-12-07

    申请号:CN201610520993.4

    申请日:2016-07-01

    Applicant: 河海大学

    CPC classification number: G06K9/6269 G06K9/4652

    Abstract: 本发明公开了一种基于机器学习的水文曲线提取方法。本发明方法对水文资料图像进行曲线提取时,选用并提取图像中具有辨别能力的某些特征,并采用尺度可变的采样窗口对一定区域的图像像素进行采样,作为样本数据,通过机器学习的方法划分具有不同特征的图像成分,且根据分类效果通过增量方式添加新的训练样本;并利用链码跟踪进行后处理,有效的除去了分类后产生的噪声影响。相比现有技术,本发明解决了要提取的水文曲线较细时尤为突出的目标曲线断线问题,而该问题在原有的水文曲线提取方法中难以得到有效解决。

Patent Agency Ranking