-
公开(公告)号:CN114090654B
公开(公告)日:2025-04-01
申请号:CN202111373215.4
申请日:2021-11-19
Applicant: 北京信息科技大学
IPC: G06F16/2458 , G06F16/2455 , G06F16/2453
Abstract: 本发明涉及一种工业时序数据的近似查询处理方法、系统、介质及设备,其包括:将时序数据进行初次压缩,得到满足初始压缩精度的压缩数据;计算所述压缩数据的标准差,根据所述标准差得到压缩精度浮动;根据所述压缩精度浮动调整压缩精度,利用调整好的所述压缩精度重新进行数据压缩,直到压缩精度浮动满足预先设定条件,输出压缩后的数据;将所述压缩后的数据进行近似查询,若查询的压缩点位处于压缩点损失区间内,则对损失点位的数值进行近似估计后再进行近似查询;反之,则直接对压缩后剩余的点位进行存在性查询,得到精确的点位数值。本发明能够在海量的工业时序数据的持续产出的情况下,高效压缩时序数据并且保留数据趋势进行存储的情况。
-
公开(公告)号:CN116304560B
公开(公告)日:2023-11-24
申请号:CN202310078949.2
申请日:2023-01-17
Applicant: 北京信息科技大学
IPC: G06F18/10 , G06F18/213 , G06N3/0455 , G06N3/0895 , G06N3/084 , G06N3/088 , G06F16/29 , G06F16/23
Abstract: 本发明提供一种基于多尺度增强对比学习的轨迹表征模型训练方法、表征方法及装置,将经纬度坐标转化为格式一致的Google S2网格编码,能够保证在向量化的过程中保持形式统一再通过双向Transformer的编码器将轨迹各位置向量化后的网格编码和时间戳进行特征提取得到轨迹表征向量。双向Transformer的编码器通过建立正负样本以对比学习的形式进行预训练,最小化各精度层级下所述轨迹样本及其正样本的轨迹表征向量差异、最大化各精度层级下所述轨迹样本及其负样本的轨迹表征向量差异,提升对轨迹表征的稳定性和精确性,提高对原始数据稀
-
公开(公告)号:CN116304560A
公开(公告)日:2023-06-23
申请号:CN202310078949.2
申请日:2023-01-17
Applicant: 北京信息科技大学
IPC: G06F18/10 , G06F18/213 , G06N3/0455 , G06N3/0895 , G06N3/084 , G06N3/088 , G06F16/29 , G06F16/23
Abstract: 本发明提供一种基于多尺度增强对比学习的轨迹表征模型训练方法、表征方法及装置,将经纬度坐标转化为格式一致的Google S2网格编码,能够保证在向量化的过程中保持形式统一再通过双向Transformer的编码器将轨迹各位置向量化后的网格编码和时间戳进行特征提取得到轨迹表征向量。双向Transformer的编码器通过建立正负样本以对比学习的形式进行预训练,最小化各精度层级下所述轨迹样本及其正样本的轨迹表征向量差异、最大化各精度层级下所述轨迹样本及其负样本的轨迹表征向量差异,提升对轨迹表征的稳定性和精确性,提高对原始数据稀疏性和噪音的抗干扰能力。
-
公开(公告)号:CN118013362A
公开(公告)日:2024-05-10
申请号:CN202410151646.3
申请日:2024-02-02
Applicant: 北京信息科技大学
IPC: G06F18/241 , G06F18/214 , G06N3/088 , G06N20/20 , G06N3/0442
Abstract: 本发明涉及一种城市建筑异常能耗检测与优化的方法、系统、介质及设备,其包括:采用三个无监督模型基于统计的HBOS、基于机器学习的IForest和基于深度学习的EMD‑LSTM作为基学习器,将获取的待检测能耗数据集预处理后输入基学习器进行异常数据分类;将各个基学习器分类判定的处于离群和正常边缘的数据合并后,输入LLM进行标记,将LLM标记的数据与各基学习器输出的数据合并为最终的标记数据集;采用标记数据集训练XGBoost二元分类模型,将待检测的能耗数据集输入训练好的XGBoost二元分类模型,得到最终的能耗检测结果,输出异常能耗数据;同时,采用可解释人工智能分析方法对异常能耗数据进行细粒度分析和优化。本发明能有效提高异常能耗检测准确率。
-
公开(公告)号:CN120032757A
公开(公告)日:2025-05-23
申请号:CN202510024250.7
申请日:2025-01-07
Applicant: 北京信息科技大学
Abstract: 本发明提供一种化合物结构跨模态搜索方法及系统,基于CLIP模型将文本形式或图片形式的化合物结构数据进行向量化,以映射到相同语义空间,通过对预设的化合物向量数据库进行搜索,能够对化合物结构实现跨模态搜索。化合物向量数据库通过构建联合索引和跨模态相似性搜索算法,实现了高效的跨模态搜索功能。联合索引能够同时支持图像、文本向量的存储和检索,提高了搜索的速度和效率。跨模态相似性搜索算法能够综合考虑图像和文本信息的相似性,提高了搜索的准确性。通过构建向量的分片存储,实现了分布式存储向量数据的功能,能够灵活应对后期数据量增大带来的存储和检索的问题,增强了系统的可扩展性。
-
公开(公告)号:CN118673414A
公开(公告)日:2024-09-20
申请号:CN202410778358.0
申请日:2024-06-17
Applicant: 北京信息科技大学
IPC: G06F18/243 , G06Q10/083 , G06Q10/0833 , G06F18/214 , G06N5/01
Abstract: 本发明涉及一种物流运单数据处理领域,公开了一种数据流环境下的物流运单异常检测方法、系统及存储介质,其包括:将物流公司原始运单数据和原始轨迹数据分别进行预处理后,进行正负样本的选取;将负样本和正样本进行整合,生成概念漂移数据集与非概念漂移的数据集,由非概念漂移的数据集模拟运单异常的概念漂移,并从各数据集中选取能够全面反映运单与轨迹之间关系的特征;对选取的特征采用EFAT算法进行处理,得到异常检测结果。本发明检测速度快、准确率高,并具有能抵抗概念漂移的能力。
-
公开(公告)号:CN116415200A
公开(公告)日:2023-07-11
申请号:CN202310395220.8
申请日:2023-04-13
Applicant: 北京信息科技大学
IPC: G06F18/2433 , G06F18/2113 , G06N3/0442 , G06N3/0475 , G06N3/0455 , G06N3/048 , G06N3/0464 , G06N3/09 , G06N3/094 , G08G1/01
Abstract: 本发明涉及一种基于深度学习的异常车辆轨迹异常检测方法及系统,其包括:将获取的车辆轨迹数据进行网格化处理,并对网格化处理后的车辆轨迹数据基于GRU和VAE提取特征向量;将提取到的特征向量输入到构建的GRU‑WGAN模型中,GRU‑WGAN模型包括一个生成器和一个判别器,生成器和判别器均由GRU网络构成;生成器根据输入的特征向量重建轨迹特征点,重建的轨迹特征点与真实数据输入判别器中,由判别器判定轨迹是否异常,并根据判定结果更新生成器和判别器的参数,学习训练特征提取部分的输出和真实数据的潜在特征,得到判别器最优的输出结果,完成车辆轨迹数据异常检测。本发明能有效提高检测准确度,并提高了模型的可解释性和稳定性、有效性。
-
公开(公告)号:CN109934354A
公开(公告)日:2019-06-25
申请号:CN201910182491.9
申请日:2019-03-12
Applicant: 北京信息科技大学
IPC: G06N20/20
Abstract: 本发明涉及一种基于主动学习的异常数据检测方法,根据各种基础学习器的对比分析,选择基于统计的和基于相似性的模型、基于轴平行子空间划分的无监督模型作为基学习器;将各基学习器评判的离群分数处于离群和正常边界的数据合并后呈现给人类专家进行标注;从标注的数据集和各基学习器投票产生的数据集中抽样训练有监督二元分类模型,将该模型应用于全数据集,得出最终的挖掘结果。本发明基于主动学习的异常数据检测方法,结合主动学习和模型集成,提出一种基于主动学习的离群点集成挖掘方法OMAL,结合多个无监督基学习器的学习结果与人类专家知识,训练出有监督的二元分类模型,在减少工作量、提升扩展性的同时,达到了较高地准确率。
-
公开(公告)号:CN118673414B
公开(公告)日:2025-02-14
申请号:CN202410778358.0
申请日:2024-06-17
Applicant: 北京信息科技大学
IPC: G06F18/243 , G06Q10/083 , G06Q10/0833 , G06F18/214 , G06N5/01
Abstract: 本发明涉及一种物流运单数据处理领域,公开了一种数据流环境下的物流运单异常检测方法、系统及存储介质,其包括:将物流公司原始运单数据和原始轨迹数据分别进行预处理后,进行正负样本的选取;将负样本和正样本进行整合,生成概念漂移数据集与非概念漂移的数据集,由非概念漂移的数据集模拟运单异常的概念漂移,并从各数据集中选取能够全面反映运单与轨迹之间关系的特征;对选取的特征采用EFAT算法进行处理,得到异常检测结果。本发明检测速度快、准确率高,并具有能抵抗概念漂移的能力。
-
公开(公告)号:CN116938509A
公开(公告)日:2023-10-24
申请号:CN202310397256.X
申请日:2023-04-12
Applicant: 北京信息科技大学
IPC: H04L9/40
Abstract: 本发明涉及一种基于ChatGPT知识增强的网络数据流异常检测方法及系统,其包括:对获取的流式网络数据集进行基于ChatGPT知识增强处理,得到该流式网络数据集所在领域的领域知识,并获取领域知识中数据特征的最大值和最小值;基于当前数据速率与理想速率的关系,确定下一个区间自适应滑动窗口的长度,以得到区间自适应滑动窗口;将领域知识的特征的最大值和最小值融入归一化中,并将整个流式网络数据输入区间自适应滑动窗口对其进行归一化处理,得到当前窗口归一化后的数据点,并将当前窗口归一化后的数据点输入数据异常检测方法中,得到网络数据流异常检测结果。本发明能有效保证数据处理的实时性,提高异常数据的检测准确度;可以在网络安全领域中应用。
-
-
-
-
-
-
-
-
-