基于Focal Loss改进LightGBM的管网毛刺数据检测方法及存储器

    公开(公告)号:CN120067667A

    公开(公告)日:2025-05-30

    申请号:CN202411741510.4

    申请日:2024-11-29

    Abstract: 本发明涉及人工智能技术领域,具体涉及一种基于Focal Loss改进LightGBM的管网毛刺数据检测方法及存储器,包括:针对管网原始数据提取邻域特征并构建毛刺数据集;基于毛刺数据集对检测模型进行多次验证,于每次验证过程中调整检测模型的损失函数的损失函数参数;根据验证结果选择多个检测模型进行融合形成融合模型,采用融合模型对管网数据进行识别。针对现有技术中的毛刺数据样本不均衡、对模型训练效果较差的问题,引入了对损失函数进行预先验证、调整损失函数参数的验证流程。通过对损失函数的参数进行调整并进行多轮验证,能够确定在对特定的毛刺数据集的训练过程中,较好地兼顾召回率与精确率的参数组合,最后再进行融合,从而提升整体的检测效果。

    水务流量毛刺数据检测方法、系统、设备及可读介质

    公开(公告)号:CN117194752A

    公开(公告)日:2023-12-08

    申请号:CN202310984887.1

    申请日:2023-08-07

    Abstract: 本申请提供了一种水务流量毛刺数据检测方法、系统、设备及介质,方法包括获取水务流量数据,根据所述水务流量数据按照时间序列进行处理,得到所述水务流量数据的变化值数据,根据所述变化值数据得到平均波动系数;根据所述水务流量数据和所述平均波动系数,按照时间序列进行处理,得到所述水务流量数据的波动倍数;根据所述波动倍数确定流量毛刺数据。本申请通过对水务流量数据进行时间序列处理和波动倍数计算,可以检测出管网流量、压力、水质设备时序数据中的毛刺数据,准确率高。找到毛刺数据并针对性进行修复,大幅度降低监测点误报率。

    一种样本可扩展的水泵故障诊断方法和系统

    公开(公告)号:CN119150194A

    公开(公告)日:2024-12-17

    申请号:CN202411302307.7

    申请日:2024-09-18

    Abstract: 本发明提供一种样本可扩展的水泵故障诊断方法和系统,步骤A1,获取水泵有无故障的声音片段作为样本与故障类型形成种子样本集;步骤A2,从种子样本集中进行目标特征类型筛选,并提取第一声音特征数据;步骤A3,从待诊断的声音片段中提取目标特征类型的第二声音特征数据;步骤A4,比对第二和第一声音特征数据识别水泵的故障类型:若无故障,获取下一轮待诊断的声音片段继续步骤A3;若有故障,步骤A6,将识别的声音片段作为样本与故障类型加入种子样本集,获取下一轮待诊断的声音片段继续步骤A2。通过少量的样本对水泵运行的声音片段进行筛选,可扩展的收集水泵故障噪声样本,不需要假设数据的分布,也不需要训练过程。

    基于子图结构信息增强的大语言模型知识图谱补全方法

    公开(公告)号:CN118674026A

    公开(公告)日:2024-09-20

    申请号:CN202410691219.4

    申请日:2024-05-30

    Abstract: 本发明涉及知识图谱技术领域,具体涉及一种基于子图结构信息增强的大语言模型知识图谱补全方法,包括:步骤S1:针对已有知识图谱抽取子图结构信息;步骤S2:依照子图结构信息确定补全任务类型,并依照子图结构信息和补全任务类型构建提示文本序列;步骤S3:将提示文本序列输入知识图谱补全大模型,知识图谱补全大模型的输出结果对应于已有知识图谱的缺失信息。引入了基于子图结构信息的处理过程,从而确定要补完的对象的补全任务类型,进而调用特定的模板来组装提示文本序列,实现了对隐含的子图结构信息的有效描述,进而使得大型语言模型能够正确理解缺失信息在知识图谱中相对于其他节点的关系,便于大型语言模型更为准确地推断出相应的结果。

Patent Agency Ranking