面向水务行业的元数据模型构建方法及元数据管理平台

    公开(公告)号:CN117708086A

    公开(公告)日:2024-03-15

    申请号:CN202311726616.2

    申请日:2023-12-14

    Inventor: 孙恺 薛浩 袁丹

    Abstract: 本发明涉及水务技术领域,具体涉及面向水务行业的元数据模型构建方法及元数据管理平台。方法包括,步骤S1,整理水务行业的业务过程,以及水务行业涉及的数据分析和共享场景;步骤S2,根据业务过程、数据分析和共享场景收集核心元数据;步骤S3,建立水务行业的元数据模型,元数据模型包括用于描述业务过程的业务场景类元数据、用于面向水务行业数据分析主题的数据分析类元数据和用于支撑水务行业数据应用场景的数据共享类元数据;步骤S4,将元数据模型映射到数据库表结构。本发明通过构建水务行业的元数据模型,实现了水务行业全领域数据的整合,解决了跨领域的数据分析的需要,统一了分析指标的口径。

    一种智能投加模型的生成系统及方法

    公开(公告)号:CN114064623A

    公开(公告)日:2022-02-18

    申请号:CN202111285291.X

    申请日:2021-11-01

    Abstract: 本发明提供一种智能投加模型的生成系统及方法,包括:由获取的水厂的多种历史水质数据及对应的混凝剂的真实投加量中提取得到多种关键水质数据;获取并处理到的多个机器学习模型中两两之间的误差差异度的相关系数,以筛选得到相关系数小于一阈值对应的各机器学习模型作为基学习器;将各种关键水质数据及对应的真实投加量划分为多个数据集,针对每个基学习器,采用交叉验证方式训练各基学习器,并根据训练完成的基学习器和各数据集处理得到新测试集和新训练集;根据新测试集和新训练集对元学习器进行训练,并根据训练完成的各基学习器和元学习器生成智能投加模型。有益效果是能够为水厂提供精准可靠的混凝剂的预测投加量。

    基于子图结构信息增强的大语言模型知识图谱补全方法

    公开(公告)号:CN118674026A

    公开(公告)日:2024-09-20

    申请号:CN202410691219.4

    申请日:2024-05-30

    Abstract: 本发明涉及知识图谱技术领域,具体涉及一种基于子图结构信息增强的大语言模型知识图谱补全方法,包括:步骤S1:针对已有知识图谱抽取子图结构信息;步骤S2:依照子图结构信息确定补全任务类型,并依照子图结构信息和补全任务类型构建提示文本序列;步骤S3:将提示文本序列输入知识图谱补全大模型,知识图谱补全大模型的输出结果对应于已有知识图谱的缺失信息。引入了基于子图结构信息的处理过程,从而确定要补完的对象的补全任务类型,进而调用特定的模板来组装提示文本序列,实现了对隐含的子图结构信息的有效描述,进而使得大型语言模型能够正确理解缺失信息在知识图谱中相对于其他节点的关系,便于大型语言模型更为准确地推断出相应的结果。

    一种用水场景下的用户标签体系搭建方法

    公开(公告)号:CN117909788A

    公开(公告)日:2024-04-19

    申请号:CN202311870358.5

    申请日:2023-12-29

    Abstract: 本发明涉及水务标签技术领域,具体涉及一种用水场景下的用户标签体系搭建方法,包括,步骤S1,根据用水场景下的标签用途,对待获得的用户标签进行规划分类;步骤S2,通过设定的加工方法进行标签加工,生成用户标签;步骤S3,获取用户信息进行特征处理,标注后形成样本数据集,建立一算法模型,采用样本数据集进行训练,建立用户参数与用户价值指标之间的关系,获得分类模型,采用分类模型对用户进行用户标签的划分和预测。本发明利用用户用水生命周期内的信息基于规则、机器学习算法等方式完成用户标签体系搭建,可以广泛应用到用水业务场景中。

    一种样本可扩展的水泵故障诊断方法和系统

    公开(公告)号:CN119150194A

    公开(公告)日:2024-12-17

    申请号:CN202411302307.7

    申请日:2024-09-18

    Abstract: 本发明提供一种样本可扩展的水泵故障诊断方法和系统,步骤A1,获取水泵有无故障的声音片段作为样本与故障类型形成种子样本集;步骤A2,从种子样本集中进行目标特征类型筛选,并提取第一声音特征数据;步骤A3,从待诊断的声音片段中提取目标特征类型的第二声音特征数据;步骤A4,比对第二和第一声音特征数据识别水泵的故障类型:若无故障,获取下一轮待诊断的声音片段继续步骤A3;若有故障,步骤A6,将识别的声音片段作为样本与故障类型加入种子样本集,获取下一轮待诊断的声音片段继续步骤A2。通过少量的样本对水泵运行的声音片段进行筛选,可扩展的收集水泵故障噪声样本,不需要假设数据的分布,也不需要训练过程。

    基于Focal Loss改进LightGBM的管网毛刺数据检测方法及存储器

    公开(公告)号:CN120067667A

    公开(公告)日:2025-05-30

    申请号:CN202411741510.4

    申请日:2024-11-29

    Abstract: 本发明涉及人工智能技术领域,具体涉及一种基于Focal Loss改进LightGBM的管网毛刺数据检测方法及存储器,包括:针对管网原始数据提取邻域特征并构建毛刺数据集;基于毛刺数据集对检测模型进行多次验证,于每次验证过程中调整检测模型的损失函数的损失函数参数;根据验证结果选择多个检测模型进行融合形成融合模型,采用融合模型对管网数据进行识别。针对现有技术中的毛刺数据样本不均衡、对模型训练效果较差的问题,引入了对损失函数进行预先验证、调整损失函数参数的验证流程。通过对损失函数的参数进行调整并进行多轮验证,能够确定在对特定的毛刺数据集的训练过程中,较好地兼顾召回率与精确率的参数组合,最后再进行融合,从而提升整体的检测效果。

    水务流量毛刺数据检测方法、系统、设备及可读介质

    公开(公告)号:CN117194752A

    公开(公告)日:2023-12-08

    申请号:CN202310984887.1

    申请日:2023-08-07

    Abstract: 本申请提供了一种水务流量毛刺数据检测方法、系统、设备及介质,方法包括获取水务流量数据,根据所述水务流量数据按照时间序列进行处理,得到所述水务流量数据的变化值数据,根据所述变化值数据得到平均波动系数;根据所述水务流量数据和所述平均波动系数,按照时间序列进行处理,得到所述水务流量数据的波动倍数;根据所述波动倍数确定流量毛刺数据。本申请通过对水务流量数据进行时间序列处理和波动倍数计算,可以检测出管网流量、压力、水质设备时序数据中的毛刺数据,准确率高。找到毛刺数据并针对性进行修复,大幅度降低监测点误报率。

Patent Agency Ranking