-
公开(公告)号:CN118013362A
公开(公告)日:2024-05-10
申请号:CN202410151646.3
申请日:2024-02-02
Applicant: 北京信息科技大学
IPC: G06F18/241 , G06F18/214 , G06N3/088 , G06N20/20 , G06N3/0442
Abstract: 本发明涉及一种城市建筑异常能耗检测与优化的方法、系统、介质及设备,其包括:采用三个无监督模型基于统计的HBOS、基于机器学习的IForest和基于深度学习的EMD‑LSTM作为基学习器,将获取的待检测能耗数据集预处理后输入基学习器进行异常数据分类;将各个基学习器分类判定的处于离群和正常边缘的数据合并后,输入LLM进行标记,将LLM标记的数据与各基学习器输出的数据合并为最终的标记数据集;采用标记数据集训练XGBoost二元分类模型,将待检测的能耗数据集输入训练好的XGBoost二元分类模型,得到最终的能耗检测结果,输出异常能耗数据;同时,采用可解释人工智能分析方法对异常能耗数据进行细粒度分析和优化。本发明能有效提高异常能耗检测准确率。
-
公开(公告)号:CN120015181A
公开(公告)日:2025-05-16
申请号:CN202510024254.5
申请日:2025-01-07
Applicant: 北京信息科技大学
IPC: G16C20/90 , G16C20/40 , G16C20/70 , G06F16/22 , G06F16/215 , G06F16/28 , G06F16/901
Abstract: 本发明提供一种化合物向量数据库构建方法、化合物相似搜索方法及装置,对多个数据源的化合物结构数据进行清洗、结构编码和向量化,对每个化合物按照其分子基本性质和结构属性形成形式统一的特征向量。将特征向量通过向量数据库进行存储并建立索引,得到化合物向量数据库。在应用过程中,对于需要检索的化合物的结构数据,首先进行结构编码和向量化,再对化合物向量数据库进行查找并输出最相似的多个化合物作为检索结果,借助索引能够实现对大规模化合物数据库中化合物结构的快速、准确检索,在药物发现、材料设计等领域具有广泛的应用前景,为科研人员提供了强大的工具支持。
-
公开(公告)号:CN118673414B
公开(公告)日:2025-02-14
申请号:CN202410778358.0
申请日:2024-06-17
Applicant: 北京信息科技大学
IPC: G06F18/243 , G06Q10/083 , G06Q10/0833 , G06F18/214 , G06N5/01
Abstract: 本发明涉及一种物流运单数据处理领域,公开了一种数据流环境下的物流运单异常检测方法、系统及存储介质,其包括:将物流公司原始运单数据和原始轨迹数据分别进行预处理后,进行正负样本的选取;将负样本和正样本进行整合,生成概念漂移数据集与非概念漂移的数据集,由非概念漂移的数据集模拟运单异常的概念漂移,并从各数据集中选取能够全面反映运单与轨迹之间关系的特征;对选取的特征采用EFAT算法进行处理,得到异常检测结果。本发明检测速度快、准确率高,并具有能抵抗概念漂移的能力。
-
公开(公告)号:CN116938509A
公开(公告)日:2023-10-24
申请号:CN202310397256.X
申请日:2023-04-12
Applicant: 北京信息科技大学
IPC: H04L9/40
Abstract: 本发明涉及一种基于ChatGPT知识增强的网络数据流异常检测方法及系统,其包括:对获取的流式网络数据集进行基于ChatGPT知识增强处理,得到该流式网络数据集所在领域的领域知识,并获取领域知识中数据特征的最大值和最小值;基于当前数据速率与理想速率的关系,确定下一个区间自适应滑动窗口的长度,以得到区间自适应滑动窗口;将领域知识的特征的最大值和最小值融入归一化中,并将整个流式网络数据输入区间自适应滑动窗口对其进行归一化处理,得到当前窗口归一化后的数据点,并将当前窗口归一化后的数据点输入数据异常检测方法中,得到网络数据流异常检测结果。本发明能有效保证数据处理的实时性,提高异常数据的检测准确度;可以在网络安全领域中应用。
-
公开(公告)号:CN116738272A
公开(公告)日:2023-09-12
申请号:CN202310387078.2
申请日:2023-04-12
Applicant: 北京信息科技大学
IPC: G06F18/24 , G06F18/214 , G06Q30/0251 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种移动广告点击流量中异常数据检测方法及系统,其包括:获取移动广告点击流量表格数据集,分别对数据集中的数值特征和分类特征进行预处理,并随机划分为训练集和测试集;将训练集输入预先构建的异常移动流量表格数据模型中,采用流量表格数据表征学习借口任务,并通过自监督预训练提供上下文知识先验对异常移动流量表格数据模型进行训练,获取训练好的异常移动流量表格数据模型;将测试集输入训练好的异常移动流量表格数据模型中,得到移动广告点击流量中的虚假点击流量数据。本发明能有效检测出虚假无效点击流量数据,避免无效流量造成的损失,可以在异常数据处理领域中应用。
-
公开(公告)号:CN120032757A
公开(公告)日:2025-05-23
申请号:CN202510024250.7
申请日:2025-01-07
Applicant: 北京信息科技大学
Abstract: 本发明提供一种化合物结构跨模态搜索方法及系统,基于CLIP模型将文本形式或图片形式的化合物结构数据进行向量化,以映射到相同语义空间,通过对预设的化合物向量数据库进行搜索,能够对化合物结构实现跨模态搜索。化合物向量数据库通过构建联合索引和跨模态相似性搜索算法,实现了高效的跨模态搜索功能。联合索引能够同时支持图像、文本向量的存储和检索,提高了搜索的速度和效率。跨模态相似性搜索算法能够综合考虑图像和文本信息的相似性,提高了搜索的准确性。通过构建向量的分片存储,实现了分布式存储向量数据的功能,能够灵活应对后期数据量增大带来的存储和检索的问题,增强了系统的可扩展性。
-
公开(公告)号:CN118673414A
公开(公告)日:2024-09-20
申请号:CN202410778358.0
申请日:2024-06-17
Applicant: 北京信息科技大学
IPC: G06F18/243 , G06Q10/083 , G06Q10/0833 , G06F18/214 , G06N5/01
Abstract: 本发明涉及一种物流运单数据处理领域,公开了一种数据流环境下的物流运单异常检测方法、系统及存储介质,其包括:将物流公司原始运单数据和原始轨迹数据分别进行预处理后,进行正负样本的选取;将负样本和正样本进行整合,生成概念漂移数据集与非概念漂移的数据集,由非概念漂移的数据集模拟运单异常的概念漂移,并从各数据集中选取能够全面反映运单与轨迹之间关系的特征;对选取的特征采用EFAT算法进行处理,得到异常检测结果。本发明检测速度快、准确率高,并具有能抵抗概念漂移的能力。
-
公开(公告)号:CN116415200A
公开(公告)日:2023-07-11
申请号:CN202310395220.8
申请日:2023-04-13
Applicant: 北京信息科技大学
IPC: G06F18/2433 , G06F18/2113 , G06N3/0442 , G06N3/0475 , G06N3/0455 , G06N3/048 , G06N3/0464 , G06N3/09 , G06N3/094 , G08G1/01
Abstract: 本发明涉及一种基于深度学习的异常车辆轨迹异常检测方法及系统,其包括:将获取的车辆轨迹数据进行网格化处理,并对网格化处理后的车辆轨迹数据基于GRU和VAE提取特征向量;将提取到的特征向量输入到构建的GRU‑WGAN模型中,GRU‑WGAN模型包括一个生成器和一个判别器,生成器和判别器均由GRU网络构成;生成器根据输入的特征向量重建轨迹特征点,重建的轨迹特征点与真实数据输入判别器中,由判别器判定轨迹是否异常,并根据判定结果更新生成器和判别器的参数,学习训练特征提取部分的输出和真实数据的潜在特征,得到判别器最优的输出结果,完成车辆轨迹数据异常检测。本发明能有效提高检测准确度,并提高了模型的可解释性和稳定性、有效性。
-
-
-
-
-
-
-