城市建筑异常能耗检测与优化的方法、系统、介质及设备

    公开(公告)号:CN118013362A

    公开(公告)日:2024-05-10

    申请号:CN202410151646.3

    申请日:2024-02-02

    Abstract: 本发明涉及一种城市建筑异常能耗检测与优化的方法、系统、介质及设备,其包括:采用三个无监督模型基于统计的HBOS、基于机器学习的IForest和基于深度学习的EMD‑LSTM作为基学习器,将获取的待检测能耗数据集预处理后输入基学习器进行异常数据分类;将各个基学习器分类判定的处于离群和正常边缘的数据合并后,输入LLM进行标记,将LLM标记的数据与各基学习器输出的数据合并为最终的标记数据集;采用标记数据集训练XGBoost二元分类模型,将待检测的能耗数据集输入训练好的XGBoost二元分类模型,得到最终的能耗检测结果,输出异常能耗数据;同时,采用可解释人工智能分析方法对异常能耗数据进行细粒度分析和优化。本发明能有效提高异常能耗检测准确率。

    化合物向量数据库构建方法、化合物相似搜索方法及装置

    公开(公告)号:CN120015181A

    公开(公告)日:2025-05-16

    申请号:CN202510024254.5

    申请日:2025-01-07

    Inventor: 张静乐 李莉

    Abstract: 本发明提供一种化合物向量数据库构建方法、化合物相似搜索方法及装置,对多个数据源的化合物结构数据进行清洗、结构编码和向量化,对每个化合物按照其分子基本性质和结构属性形成形式统一的特征向量。将特征向量通过向量数据库进行存储并建立索引,得到化合物向量数据库。在应用过程中,对于需要检索的化合物的结构数据,首先进行结构编码和向量化,再对化合物向量数据库进行查找并输出最相似的多个化合物作为检索结果,借助索引能够实现对大规模化合物数据库中化合物结构的快速、准确检索,在药物发现、材料设计等领域具有广泛的应用前景,为科研人员提供了强大的工具支持。

    基于ChatGPT知识增强的网络数据流异常检测方法及系统

    公开(公告)号:CN116938509A

    公开(公告)日:2023-10-24

    申请号:CN202310397256.X

    申请日:2023-04-12

    Abstract: 本发明涉及一种基于ChatGPT知识增强的网络数据流异常检测方法及系统,其包括:对获取的流式网络数据集进行基于ChatGPT知识增强处理,得到该流式网络数据集所在领域的领域知识,并获取领域知识中数据特征的最大值和最小值;基于当前数据速率与理想速率的关系,确定下一个区间自适应滑动窗口的长度,以得到区间自适应滑动窗口;将领域知识的特征的最大值和最小值融入归一化中,并将整个流式网络数据输入区间自适应滑动窗口对其进行归一化处理,得到当前窗口归一化后的数据点,并将当前窗口归一化后的数据点输入数据异常检测方法中,得到网络数据流异常检测结果。本发明能有效保证数据处理的实时性,提高异常数据的检测准确度;可以在网络安全领域中应用。

    一种移动广告点击流量中异常数据检测方法及系统

    公开(公告)号:CN116738272A

    公开(公告)日:2023-09-12

    申请号:CN202310387078.2

    申请日:2023-04-12

    Abstract: 本发明涉及一种移动广告点击流量中异常数据检测方法及系统,其包括:获取移动广告点击流量表格数据集,分别对数据集中的数值特征和分类特征进行预处理,并随机划分为训练集和测试集;将训练集输入预先构建的异常移动流量表格数据模型中,采用流量表格数据表征学习借口任务,并通过自监督预训练提供上下文知识先验对异常移动流量表格数据模型进行训练,获取训练好的异常移动流量表格数据模型;将测试集输入训练好的异常移动流量表格数据模型中,得到移动广告点击流量中的虚假点击流量数据。本发明能有效检测出虚假无效点击流量数据,避免无效流量造成的损失,可以在异常数据处理领域中应用。

    一种化合物结构跨模态搜索方法及系统

    公开(公告)号:CN120032757A

    公开(公告)日:2025-05-23

    申请号:CN202510024250.7

    申请日:2025-01-07

    Abstract: 本发明提供一种化合物结构跨模态搜索方法及系统,基于CLIP模型将文本形式或图片形式的化合物结构数据进行向量化,以映射到相同语义空间,通过对预设的化合物向量数据库进行搜索,能够对化合物结构实现跨模态搜索。化合物向量数据库通过构建联合索引和跨模态相似性搜索算法,实现了高效的跨模态搜索功能。联合索引能够同时支持图像、文本向量的存储和检索,提高了搜索的速度和效率。跨模态相似性搜索算法能够综合考虑图像和文本信息的相似性,提高了搜索的准确性。通过构建向量的分片存储,实现了分布式存储向量数据的功能,能够灵活应对后期数据量增大带来的存储和检索的问题,增强了系统的可扩展性。

Patent Agency Ranking