一种基于层次聚类的符号化水文时间序列异常模式检测方法

    公开(公告)号:CN110532297A

    公开(公告)日:2019-12-03

    申请号:CN201910706159.8

    申请日:2019-08-01

    Applicant: 河海大学

    Inventor: 万定生 杨瑞

    Abstract: 本发明公开了一种基于层次聚类的符号化水文时间序列异常模式检测方法,包括对原始时间序列水文数据进行扩展符号聚集近似表示(ESAX);采用基于特征向量的层次聚类法对得到的特征向量进行聚类;对待检测的对象进行异常模式检测。本发明方法将符号化表示方法与基于聚类的异常检测方法相结合。先通过扩展符号聚集近似算法对时间序列进行分段并符号化表示,再将得到的特征向量进行层次聚类,利用聚类结果挖掘出正常的数据模式来建立模型,并通过度量待检测对象与模型之间的距离来判定异常模式。

    一种跨内外网的分布式索引资源整合与共享方法

    公开(公告)号:CN106960037B

    公开(公告)日:2019-09-10

    申请号:CN201710174884.6

    申请日:2017-03-22

    Applicant: 河海大学

    Abstract: 本发明公开了一种跨内外网的分布式索引资源整合与共享方法,包含如下三个模块:分布式存储模块:将行业所生产的数据按照具体的需求划分成不同的类别,并将数据注册生成索引,不同类别的数据将会存储在不同的物理节点上;共享模块:内外网数据分布于同一个集群不同的物理节点中,内网利用网闸的文件摆渡的方式,向外网平台提供索引数据的部分或全部信息,外网向内网提供请求;分布式检索模块:对集中整合在外网上的不同数据索引进行分布式检索,并可根据检索结果向内网回调获取详细信息。本发明实现不同类别的数据的分布式索引机制和内外网闸间的数据共享机制,并且基于大数据平台,能够近实时的分布式处理大量的数据,满足用户的检索、共享等需求。

    基于Boosting算法和支持向量机的洪水预报方法

    公开(公告)号:CN105139093B

    公开(公告)日:2019-05-31

    申请号:CN201510564457.X

    申请日:2015-09-07

    Applicant: 河海大学

    CPC classification number: Y02A10/46

    Abstract: 本发明公开了一种基于Boosting算法和支持向量机的洪水预报方法,该方法包括如下步骤:运用相关系数法确定预报因子;利用核主成分分析对所述预报因子进行降维处理;利用Boosting算法选取样本建立多个支持向量机预测模型,引入损失函数和相关系数调整样本权重,最后组合为一个总预测模型;利用所述总预测模型对测试样本进行预测。本发明前两个步骤是数据预处理,目的是提取洪水数据中的有用信息,消除冗余信息对预报造成的干扰。第三个步骤将Boosting算法引入到洪水预报中,尽量将前一个模型不能很好学习的样本,抽取出来用于训练下一个模型,这样组合后的模型可以有效提高洪水预报准确率,最后一个步骤用于检验模型效果。实验数据表明本方案能很好地提高预报精度。

    基于汉语模糊发音和语音识别的中文文本校验系统及方法

    公开(公告)号:CN105302795B

    公开(公告)日:2018-03-20

    申请号:CN201510767379.3

    申请日:2015-11-11

    Applicant: 河海大学

    Abstract: 本发明公开一种基于汉语模糊发音和语音识别的中文文本校验系统及方法。系统包括:语音采集与处理模块,采集音频,并完成音频的压缩与降噪处理;语音识别模块,将语音识别成文本;文本校验与分享模块,实现文本校验,同时支持文本编辑和分享。方法定义基于词性的中文判错规则;对语音识别后的中文文本进行分词;根据中文判错规则,扫描分词找出中文错词;基于汉语模糊发音规则,定义模糊发音表;通过笛卡尔乘积方式找出错词的所有模糊拼音;查询词典表获取每个模糊拼音的词语候选集;对所有模糊拼音的候选集词语按照词频排序选出纠错候选集。本发明解决了由于汉语模糊发音造成的语音识别中的中文错误,有效提高了校验算法的纠错正确率。

    一种Web Service QoS组合预测方法

    公开(公告)号:CN104270281B

    公开(公告)日:2017-09-19

    申请号:CN201410447471.7

    申请日:2014-09-03

    Applicant: 河海大学

    Abstract: 本发明公开一种Web Service QoS组合预测方法,用时间序列预测模型从统计学角度进行数据分析,线性非线性时间序列分别建立ARIMA模型或者SETAR模型,预测未来QoS属性值;同时通过GM(1,1)模型模拟出整个QoS属性值发展趋势,对即使有数据缺失的情况,亦可建立高效的灰色预测模型进行预测;再采用递阶遗传算法优化后的径向基神经网络作为模型平台,以时间序列预测模型和GM(1,1)的预测结果作为神经网络的输入源,以递阶遗传算法训练径向基神经网络的参数。通过将不同预测模型进行适当地组合,形成所谓的组合预测方法,综合利用各种方法提供的有用信息,有利于提高输入质量,使得组合预测模型在效率、质量上优于单一模型,产生更好的预测结果。

    一种跨内外网的分布式索引资源整合与共享方法

    公开(公告)号:CN106960037A

    公开(公告)日:2017-07-18

    申请号:CN201710174884.6

    申请日:2017-03-22

    Applicant: 河海大学

    Abstract: 本发明公开了一种跨内外网的分布式索引资源整合与共享方法,包含如下三个模块:分布式存储模块:将行业所生产的数据按照具体的需求划分成不同的类别,并将数据注册生成索引,不同类别的数据将会存储在不同的物理节点上;共享模块:内外网数据分布于同一个集群不同的物理节点中,内网利用网闸的文件摆渡的方式,向外网平台提供索引数据的部分或全部信息,外网向内网提供请求;分布式检索模块:对集中整合在外网上的不同数据索引进行分布式检索,并可根据检索结果向内网回调获取详细信息。本发明实现不同类别的数据的分布式索引机制和内外网闸间的数据共享机制,并且基于大数据平台,能够近实时的分布式处理大量的数据,满足用户的检索、共享等需求。

    面向水利数据整合与共享的索引方法

    公开(公告)号:CN104090949B

    公开(公告)日:2017-03-01

    申请号:CN201410313144.2

    申请日:2014-07-02

    Applicant: 河海大学

    Abstract: 本发明提供一种面向水利数据整合与共享的索引方法,包括:S1:根据时间粒度对保存的数据进行划分,定义不同粒度层次,并对时间粒度映射时间量化值,并且为数据进行对象分类,定义对象分类编码,其中:所述保存的数据包括按时间采集的水利数据和按地区采集的水利数据;S2:对分类后的数据按照索引机制建立实时索引和历史索引;S3:对建立索引机制后的数据进行查询,当按坐标查询时,转向步骤S4,当按对象分类查询时,转向步骤S5;S4:根据坐标与索引中的外包矩形关系进行查询;S5:根据分类编码序列与索引中的序列编码进行按位“与或”运算来查询;S6:若要继续查询新的数据,则转向步骤S4,否则结束。本发明提供方法能够提高水利数据的检索效率。

    基于传播时间聚类分析的多模型集成洪水预报方法

    公开(公告)号:CN103729550B

    公开(公告)日:2016-08-17

    申请号:CN201310699773.9

    申请日:2013-12-18

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于传播时间聚类分析的多模型集成洪水预报方法,属于水文预报技术领域。首先采用派生的动态时间弯曲匹配方法进行洪水过程相似性分析,估计上下游各站点的流量传播时间,并通过对流量传播时间进行聚类分析将样本分解为若干簇,然后分别对子流量序列建立SVM回归模型模拟洪水形成过程,最后再将这些子模型合并成一个综合模型。将该方法的综合预测结果与常规条件下的单一模型和基于流量聚类的模型预测结果相比较,结果显示该模型综合表现更佳。

Patent Agency Ranking