-
公开(公告)号:CN117891938A
公开(公告)日:2024-04-16
申请号:CN202311646148.8
申请日:2023-12-04
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/35 , G06F40/194 , G06F18/23213 , G06F18/22
Abstract: 本发明公开了一种基于最小哈希和数据流的大规模相似文本聚类方法。首先将原始文本数据转化为byte类型数据,然后提取数据块的k‑shingle,映射成哈希值,使用转置函数生成最小哈希签名,根据得到的哈希签名进行初始化聚类空间,随后开始进行数据流聚类,数据按照类顺序与类中心进行雅可比相似度计算。同时,考虑到时间的进行,类中心可能发生变化,设计数据块雅可比相似总和来对类中心进行更新。
-
公开(公告)号:CN117612010A
公开(公告)日:2024-02-27
申请号:CN202311646156.2
申请日:2023-12-04
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明公开了一种基于鸟瞰图流时序协同感知的测绘数据融合方法,通过采集得到的异步数据,生成感兴趣的ROI区域,并在收到不同时间戳的其他智能体的协作消息后,经过两个关键步骤:相邻时间戳ROI匹配和BEV流估计,生成鸟瞰图流图,以纠正由于异步而导致的特征不对齐。之后通过流图和映射的特征,实现数据融合,再按照数据质量评估标准进行评估,得到一个最终的异步数据融合结果。
-
公开(公告)号:CN117411696A
公开(公告)日:2024-01-16
申请号:CN202311407722.4
申请日:2023-10-25
Applicant: 电子科技大学长三角研究院(湖州)
IPC: H04L9/40 , G06F18/24 , G06F18/2321 , G06N3/0895 , G06F21/55
Abstract: 基于人工智能(AI)的传感器在解释来自各种行业的数据,包括工业物联网(IIoT)和移动设备中起着至关重要的作用。本发明展示了一个适应性的、基于原型的半监督学习框架,专为处理不断演变的IIoT数据流中的入侵检测而设计。该发明解决了IIoT数据处理中的两个重要挑战:概念漂移,即输入特征与目标变量之间的关系随着时间的推移而变化;以及概念演变,即数据流中新类别的出现。提出的框架采用了一种新颖的分类器,引入了一种独特的数据抽象方法,这种方法在多个粒度级别创建动态原型,总结数据流并有效地捕获本地数据分布。这种分类器在迅速处理数据、基于最新信息做出实时决策方面,独具优势,其能力在动态的物联网环境中至关重要。该模型的一个重要特性是其能够适应本地概念漂移并直观地检测出新出现的入侵攻击,它会自动确定原型随时间的重要性,使模型能够快速适应底层数据分布的变化。这种快速适应减少了由于概念漂移导致的数据分布变化对模型性能的下降。此外,还引入了一种主动学习技术,大大减少了手动标记的需求,同时保持甚至提高了模型的性能。
-
公开(公告)号:CN117370735A
公开(公告)日:2024-01-09
申请号:CN202311393691.1
申请日:2023-10-25
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F18/10 , G06F18/23 , G06F18/2413 , G06N3/0895 , G06N5/022
Abstract: 本发明提出了一种可适应的基于传感器数据流的人类活动识别框架,涉及使用在线学习和主动学习进行HAR。与传统方法不同,在线学习将数据视为一个持续流动的数据流,使系统能够持续学习并适应变化,如个人活动模式的变化或传感器测量的转变。大多数传统的HAR方法假定人工数据注释或标记,这可能非常耗时和挑战性。为了解决这个问题,我们引入主动学习,该算法主动选择训练实例。主动学习可以查询用户关于模糊活动的信息,有效地引导学习过程,使用更少的标记数据实例,简化注解过程。因此,该发明的重要贡献是将在线学习和主动学习引入基于传感器的HAR方法,可能提高适应性和效率,并减少劳动强度。这种方法考虑到环境或用户行为的动态变化,并优化了注释过程,使得HAR在现实世界的应用中更有效。
-
公开(公告)号:CN117237686A
公开(公告)日:2023-12-15
申请号:CN202311397171.8
申请日:2023-10-25
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06V10/762 , G06V10/80 , G06V10/82 , G16H30/00 , G06T9/00
Abstract: 本发明公开了一种基于自编码器的肠癌全视野数字切片聚类方法。考虑到肠癌患者的多种患病因素,希望能进一步挖掘肠癌患者全视野数字切片中的潜在模式,从而提高对于肠癌患病因素的分析、预防和诊断能力。故本发明从自编码器的无监督特性以及强大的模式提取能力的角度出发,首先收集肠癌患者的全视野数字切片(WSI),将WSI网格化分割为多个patches,进行一定的数据清洗和增强后,再在每个patch上利用自编码器进行模式挖掘,将学习到的隐变量作为每个patch的表征,对多个patches的表征进行融合,形成原始WSI的整体表征,最后利用无监督聚类算法对每个WSI的整体表征进行聚类,最终打上聚类标签,得到聚类结果。故本发明从肠癌患者全视野数字切片聚类的角度出发,挖掘增加病人患病概率的潜在因素,为肠癌医学分析、预防和诊断提供了一种新的方法。
-
公开(公告)号:CN115859620A
公开(公告)日:2023-03-28
申请号:CN202211534229.4
申请日:2022-12-02
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明公开了一种基于多头注意力机制和图神经网络的径流重建方法。首先收集流域内与径流相关的影响特征,然后构建特征与径流对应的图数据集,设计基于多头注意力机制的图神经网络模型,根据得到的重建模型就可以进行缺失值填充。同时,考虑到GCN在关注空间特征时会忽略某些时间特征,所以加入TCN先提取时间特征,提高了模型捕获有效时间特征的能力,减少了对于流域内部水文物理机制的依赖性,有效扩大了模型的适用范围。
-
公开(公告)号:CN115757309A
公开(公告)日:2023-03-07
申请号:CN202211534851.5
申请日:2022-12-01
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/174 , G06N3/08 , G06F18/23 , G06N3/0464
Abstract: 本发明公开了一种基于回归孪生神经网络压缩友好度量学习的文件压缩方法。首先将需要将压缩文件生成固定大小的切片,构建用于训练与测试的文件切片数据集,通过深度度量学习获得具有“类内相似,类间不相似”特性的隐表征,根据隐表征进行谱聚类,合并同类的文件切片,实现文件的高压缩比压缩。同时,考虑到需要进行存储压缩的数据结构复杂,所以谱聚类的方式,谱聚类的过程对数据结构没有太多的假设而且可以通过构造稀疏的相似图,使得在更大的数据集上有更快的聚类速度。此外,本发明使用以无标签数据驱动的深度压缩友好度量与聚类的方法,减少了对数据标签的需要,有效的扩大了模型的适用范围。
-
公开(公告)号:CN113902014A
公开(公告)日:2022-01-07
申请号:CN202111179496.X
申请日:2021-10-11
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明公开了一种基于多示例学习的小样本乳腺癌细胞图像判别方法。基于元学习框架,首先将图像分割为大小相同的图像块,利用卷积神经网络提取各图像块特征,然后利用多示例表征将图像分类问题转化成一个多示例学习问题。最后引入示例级的注意力机制,以单层全连接神经网络作为分类器,自动学习乳腺癌病变部位,完成分类与定位任务。本发明能够在少量乳腺癌细胞样本的情况下对正常细胞与癌细胞图像进行建模,采用多示例学习下的注意力机制增强了模型的可解释性,可在图像中定位出癌细胞的位置以辅助医生进行诊断。
-
公开(公告)号:CN119025875A
公开(公告)日:2024-11-26
申请号:CN202410986637.6
申请日:2024-07-23
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F18/21 , G06F18/20 , G06F18/241 , G06N20/00
Abstract: 本发明的目的是引入一种专门为分类不平衡流数据而设计的新型主动学习方法。它有效地适应了实时数据流的动态挑战。该方法的核心是一个先进的数据管理系统,该系统使用复杂的结构创建紧凑的数据摘要,这对于克服内存限制至关重要。该方法使用多窗口知识库,为每个数据类设置单独的固定大小窗口,以保持独特的结构并有效地解决不平衡问题。它还包括一组动态调整以适应数据变化性的k‑最近邻k‑NN分类器。主动学习部分通过混合使用不确定性和随机抽样,专注于代表性不足的类别,优化了有限标签资源的使用。这种全面的策略不仅解决了数据变化性、新标签和类别不平衡的问题,还提高了标签过程的效率,确保在动态数据环境中实现高准确性和适应性。
-
公开(公告)号:CN118095288A
公开(公告)日:2024-05-28
申请号:CN202311661542.9
申请日:2023-12-06
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明公开了一种基于Transformer的存储数据相似度量方法。在存储领域需要将相似的数据块合并在一起,需要解决如何度量数据块的压缩友好相似性。首先将需要压缩数据生成固定大小的切块,构建用于训练与测试的切块数据集,采样获得用于生成Token的数据块,生成字典,采用8个字节为一个Token对数据进行编码,通过Transformer拟合压缩算法的压缩特性,获得具有代表的压缩表征,根据表征聚类,判断结果计算NMI。考虑到存储数据是序列数据,所以采用Transformer网络,通过多头注意力机制让模型以不同的关注方式处理不同类型的信息,提高了模型对多层次、多种信息的理解能力。
-
-
-
-
-
-
-
-
-