数据质量管理方法和系统
    51.
    发明公开

    公开(公告)号:CN102708149A

    公开(公告)日:2012-10-03

    申请号:CN201210098583.7

    申请日:2012-04-01

    Applicant: 河海大学

    Abstract: 本发明公开了一种数据质量管理方法和系统。数据质量管理方法包括如下步骤:质量知识库管理:对数据质量特点分析,预先设置质量问题域、质量维度域、质量规则域和质量标准域;质量信息采集:在质量知识库中选择用户需求的质量维度和质量规则,并从原始数据集中抽取满足用户需求的数据集;数据质量评估:根据采集的质量信息,进行数据质量评估,并根据质量知识库中的质量问题域和质量标准域,生成数据质量报告提交给用户或质量管理人员;数据质量改进:对数据质量评估中检测到的数据质量问题进行修正和改进。本发明立足于水文行业数据处理全过程,致力于整个水文行业数据质量的监控、评估和持续改善。

    一种基于CUDA的网格新安江模型并行计算方法

    公开(公告)号:CN118193207A

    公开(公告)日:2024-06-14

    申请号:CN202410346011.9

    申请日:2024-03-25

    Applicant: 河海大学

    Abstract: 本发明公开一种基于CUDA(Compute Unified Device Architecture)的网格新安江模型并行计算方法,包括依据流域网格流向信息提取网格演算次序表,实现了数据降维与GPU全局内存的合并访问;从空间离散化角度实现了网格新安江模型蒸散发模块、产流分水源模块、坡地汇流模块、河道汇流模块在英伟达GPU上的并行计算;本发明方法利用英伟达GPU实现了网格新安江模型的并行计算,显著提升了网格新安江模型的计算效率。

    基于图像特征和深度学习的相似场次降雨模式库构建方法

    公开(公告)号:CN116010795A

    公开(公告)日:2023-04-25

    申请号:CN202310261448.8

    申请日:2023-03-17

    Applicant: 河海大学

    Abstract: 本发明公开一种基于图像特征和深度学习的相似场次降雨模式库构建方法:采用滑动窗口对历史降雨图像数据集进行分割得到所有场次降雨过程;提取各场次降雨过程的降雨持续天数、场次降雨总量、各日降雨量分布、降雨空间分布以及降雨中心运动轨迹特征;并进行特征相似性度量,采用基于混沌映射的多族群灰狼优化算法对特征的相似性度量进行融合,得到场次降雨过程的最优特征融合相似性度量;采用该最优特征融合相似性度量,从场次降雨过程历史库中搜索相似场次降雨过程并进行描述和表达,以此构建相似降雨模式库。本发明解决现有技术方案中或因用时序数据难以表达场次降雨过程的时空特征信息、或因场次降雨过程特征表达及相似性度量方法不足等问题。

    一种基于时空特征的水文预报模型的构建方法

    公开(公告)号:CN112182063A

    公开(公告)日:2021-01-05

    申请号:CN202010974378.7

    申请日:2020-09-16

    Applicant: 河海大学

    Abstract: 本发明公开一种基于时空特征的水文预报模型的构建方法,将建立好的河道距离矩阵、欧氏距离矩阵和相关系数矩阵融合为水文拓扑结构图;并提取空间特征和时间特征,最后建立水文预报模型。本发明将时间特征和空间特征结合,构建基于时空特征驱动的水文预报模型。首先根据空间特征和时间序列相似性建立了三个水文关系图,河道距离矩阵、欧氏距离矩阵和相关系数矩阵,并将三者融合建立水文拓扑结构图;再将图卷积网络与门控循环单元相结合来学习空间特征表示的同时捕获水文时态特征,继而进行水文预测,提高预测精度。

    一种基于类间识别力特征的遥感场景分类方法

    公开(公告)号:CN108229451B

    公开(公告)日:2020-06-30

    申请号:CN201810223998.X

    申请日:2018-03-19

    Applicant: 河海大学

    Abstract: 本发明涉及一种基于类间识别力特征的遥感场景分类方法,找到训练样本唯一聚类质心,通过计算聚类质心与样本在特征空间中的距离,将距离曲线拐点对应的值作为阈值;通过任意两图像样本之间的距离由于阈值的大小,判断场景样本是否相似,并累加各个场景下的相似图像,计算场景重叠率;排除掉造成高重叠率的串接特征后,利用基于类内离差平方和与类间离差平方和比值的特征评价指标,为各类场景图像选择指标值最好的表示特征。实际应用中,本发明具有极高的分类准确率,并且经实验验证,本发明的全局分类准确率高于现有的一些有代表性的场景分类方法。

    一种基于ASCS的LSTM神经网络水文预测方法及系统

    公开(公告)号:CN110363349A

    公开(公告)日:2019-10-22

    申请号:CN201910633468.7

    申请日:2019-07-15

    Applicant: 河海大学

    Inventor: 万定生 阮祥超

    Abstract: 本发明公开一种基于ASCS的LSTM神经网络水文预测方法及系统,该方法包括:(1)采集一水系流域的流量雨量值及所述水系流域对应的雨量站一定时间段内的雨量,形成雨量样本数据,进而一定间隔年份的雨量样本数据形成雨量样本数据集,并对所述雨量样本数据集进行预处理;(2)采用ASCS算法对LSTM神经网络的学习率lr和隐含层节点数hidden_size参数进行寻优,同时利用雨量样本数据集对LSTM神经网络进行训练,最终得到ASCS_LSTM神经网络水文预测模型;(3)对所述ASCS_LSTM神经网络水文预测模型进行测试。本发明采用ASCS算法对LSTM模型的参数进行优化,利用最优参数得到的模型进行水文预测,准确度更高。

    基于机器学习的水文曲线提取方法

    公开(公告)号:CN106203496B

    公开(公告)日:2019-07-12

    申请号:CN201610520993.4

    申请日:2016-07-01

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于机器学习的水文曲线提取方法。本发明方法对水文资料图像进行曲线提取时,选用并提取图像中具有辨别能力的某些特征,并采用尺度可变的采样窗口对一定区域的图像像素进行采样,作为样本数据,通过机器学习的方法划分具有不同特征的图像成分,且根据分类效果通过增量方式添加新的训练样本;并利用链码跟踪进行后处理,有效的除去了分类后产生的噪声影响。相比现有技术,本发明解决了要提取的水文曲线较细时尤为突出的目标曲线断线问题,而该问题在原有的水文曲线提取方法中难以得到有效解决。

    一种基于封闭外壳片段立方体的水利普查数据挖掘方法

    公开(公告)号:CN109408514A

    公开(公告)日:2019-03-01

    申请号:CN201811275645.0

    申请日:2018-10-30

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于封闭外壳片段立方体的水利普查数据挖掘方法,首先将高维数据分成低维片段,再计算各低维片段的封闭立方体;利用位图索引、倒排索引相结合,建立存储结构表,快速判断聚集单元的封闭性,用封闭查询位图来代替封闭单元进行存储,仅保留不重复的基本单元、封闭查询位图以及对应的TID-List集合,在查询封闭外壳片段立方体时,利用查询位图和倒排索引进行查找,查找范围由原来的完全立方体所有数据单元缩小到所有基本单元,快速定位查询结果。本发明在保证查询效率的前提下,使高维数据立方体得到进一步压缩。

    一种中小河流流域相似性判别方法

    公开(公告)号:CN109388664A

    公开(公告)日:2019-02-26

    申请号:CN201811147711.6

    申请日:2018-09-29

    Applicant: 河海大学

    Abstract: 本发明公开了一种中小河流流域相似性判别方法,首先构造数据集聚类集体:选取特征指标构造特征子集,将特征子集输入基聚类算法得到聚类集体;然后构造聚类集体的相似度矩阵:构造所述聚类集体的相似度矩阵作为预设的聚类融合算法的输入矩阵;最后进行矩阵聚类融合:利用预设的聚类融合算法对所述相似度矩阵进行聚类融合,实现相似性判断,本发明充分利用中小流域的地理数据以及水文数据特征,并使用数据挖掘技术实现中小流域的相似性分析,解决水文流域相似性难以判断的技术问题。

Patent Agency Ranking