-
公开(公告)号:CN119131593A
公开(公告)日:2024-12-13
申请号:CN202411268501.8
申请日:2024-09-11
Applicant: 安徽大学
IPC: G06V20/10 , G06V10/764 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0455
Abstract: 本发明公开了一种基于语义感知的跨场景高光谱遥感图像分类方法,包括:1)对原始高光谱遥感图像数据及其标签进行处理构建源域数据集;2)将处理后的高光谱图像通过视觉特征提取模块提取视觉特征;3)将高光谱图像类别标签多级语义融合模块获得多级语义提示,并通过文本编码器获得语义特征;4)将图像特征和文本特征对齐。本发明充分利用语义信息来建立源域和目标域之间的共享知识,有效提升了高光谱图像分类的准确率。
-
公开(公告)号:CN118797093A
公开(公告)日:2024-10-18
申请号:CN202411027264.6
申请日:2024-07-30
Applicant: 安徽大学
IPC: G06F16/583 , G06V10/80 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种全局‑局部信息交互注意的遥感图像文本检索方法,包括:1、通过基于Faster R‑CNN模型的特征提取网络得到遥感图像的区域级特征表示;2、通过基于BERT模型的特征提取网络得到具有上下文信息的文本词级特征表示;3、构建基于注意力机制的全局‑局部注意力模块,得到包含全局‑局部信息的遥感图像特征;4、通过特征聚合网络得到遥感图像以及文本的整体特征;5、通过双向的三元组排序损失函数约束正样本与负样本之间的特征距离,以此训练得到最优检索模型。本发明通过获取全局‑局部信息交互注意的遥感图像特征和包含上下文信息的文本特征,从而大大提高了遥感图像文本检索的准确率。
-
公开(公告)号:CN118608871A
公开(公告)日:2024-09-06
申请号:CN202410878698.0
申请日:2024-07-02
Applicant: 安徽大学
IPC: G06V10/764 , G06V10/766 , G06V10/774 , G06V10/75 , G06V10/74 , G06N20/00
Abstract: 本发明公开了一种基于标记预测和标记增强的图像多维分类方法,包括:1构建图像多维分类训练集,2通过一对一编码将图像样本原本的标记转换为三元标记,3通过构建标记增强模型将图像样本原来的逻辑标记恢复成实数型标记分布,4基于实数型标记分布构建多输出回归模型,5将实数型标记转换成三元标记得出未知样本的预测结果。本发明通过转换图像的特征空间和标签空间的流形结构为两个独立的概率分布,促进二者紧密匹配,从而提升区分度,确保特征差异大的图像能获得更为独特的标签分布。
-
公开(公告)号:CN116935303A
公开(公告)日:2023-10-24
申请号:CN202211328891.4
申请日:2022-10-27
Applicant: 安徽大学
IPC: G06V20/52 , G06V10/44 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明涉及计算机视觉技术领域,解决了弱监督方法会引入大量标签噪声的技术问题,尤其涉及一种弱监督自训练视频异常检测方法,该检测方法包括以下步骤:S1、获取视频异常检测数据集并将其划分为训练集和测试集;S2、搭建异常检测模型并采用训练集进行训练,异常检测模型包括第一阶段网络模型和第二阶段网络模型;若异常得分大于阈值,则为异常片段;若异常得分小于阈值,则为正常片段。S3、将待检测视频输入至训练后的异常检测模型中预测每个视频片段的异常得分,根据异常阈值对视频片段中的异常进行检测。本发明达到了利用先验知识生成高置信度的伪标签,提高异常检测准确率的目的。
-
公开(公告)号:CN116935114A
公开(公告)日:2023-10-24
申请号:CN202310880906.6
申请日:2023-07-18
Applicant: 安徽大学
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06V10/766
Abstract: 本发明公开了一种基于标记增强的图像多维分类方法,包括:1)构建多维分类训练集;2)对训练集中图像样本的标记进行编码,将原始标记空间编码成三元标记空间;3)构建基于概率的标记增强模型来丰富编码标记空间中的监督信息,获得实数型标记分布;4)基于实数型标记分布构建多输出回归模型;5)对未知类图像样本进行预测。本发明通过构建基于概率的标记增强模型获得图像样本的实数型标记分布,使得特征差异较大的图像样本恢复出更具区分度的标记分布,从而解决在标记分布空间上的数据拥挤问题,并将图像的多维分类问题转化成了一个多输出回归问题,并基于实数型标记分布来构建多输出回归模型,从而提高了对图像多维分类的准确性。
-
公开(公告)号:CN116798125A
公开(公告)日:2023-09-22
申请号:CN202310798381.1
申请日:2023-07-03
Applicant: 安徽大学
IPC: G06V40/20 , G06V10/774 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于选择性部分特征融合的步态识别方法,属于步态识别技术领域,具体包括以下步骤:对步态识别数据集样本进行预处理,生成步态视频轮廓序列,将所述步态识别视频轮廓序列分批次输入3D卷积网络中进行特征提取;将提取到的特征输入到多尺度局部时间聚合模块中捕获区分性的运动特征;将所述运动特征再次输入3D卷积网络中提取细粒度的步态特征;将所述步态特征输入空间注意力模块中提取判别性的空间特征;将所述空间特征输入全连接层获取每个样本的预测概率;当训练次数达到预设次数时,输出符合要求的步态识别模型;本发明得到的步态特征更具有判别性,大大提高了对于不同个体的识别效果。
-
公开(公告)号:CN116580345A
公开(公告)日:2023-08-11
申请号:CN202211327771.2
申请日:2022-10-27
Applicant: 安徽大学
IPC: G06V20/52 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及视频异常行为检测技术领域,解决了现有检测方法中对于视频异常行为检测识别精度低、视频中重要的时序关系被忽略、对异常片段的鲁棒性差的技术问题,尤其涉及一种弱监督视频异常行为检测方法,包括以下步骤:S10、获取若干视频数据作为训练集和测试集;S20、对训练集进行预处理并提取视频数据的第一原始特征;S30、搭建异常行为检测模型,异常行为检测模型包括多尺度时序卷积网络模块和自注意力模块。本发明在多实例学习的基础上引入多尺度时序卷积网络,获取视频片段之间的长短期时序信息,获取精确到片段级别的异常评分,弱监督方法在降低人工标注成本的同时提高了异常事件检测的准确率。
-
公开(公告)号:CN118840763A
公开(公告)日:2024-10-25
申请号:CN202410805921.9
申请日:2024-06-21
Applicant: 安徽大学
Abstract: 本发明公开了一种基于轨迹预测条件扩散模型的无监督骨架视频异常检测方法,包括:1获取人体骨架数据集并进行预处理,2建立通道注意力网络模型、轨迹预测网络模型和条件扩散模型,3训练建立的网络模型架构,4利用建立好的模型实现预测。本发明能改进扩散模型的输入条件,从而能提高异常检测准确率。
-
公开(公告)号:CN117274195A
公开(公告)日:2023-12-22
申请号:CN202311231918.2
申请日:2023-09-22
Applicant: 安徽大学
IPC: G06T7/00 , G06V10/77 , G06V10/764 , G06V10/82 , G06V40/10 , G06N3/0475 , G06N3/045 , G06N3/096
Abstract: 本发明公开了一种基于边缘世界生成网络的图像异常检测方法,用于无监督的图像异常检测和定位,包括:1使用特征膨胀器来使特征向量所张成的特征维度空间足够饱满完整,2通过特征蒸馏生成器,在正常样本的特征向量所张成的特征维度空间边界,生成伪异常的边缘特征空间,从而在此边缘特征维度空间内,产生大量的伪异常特征向量。3将正常特征向量和伪异常特征向量,一起输入异常分离器,并通过韦伯变换,得到图像像素级的异常分数,由此完成图像异常的检测以及图像异常区域的定位。本发明能在无法对所有异常数据进行统计分布的建模时,可以更好的在高维特征空间中,刻画出正常样本的特征空间边界,从而通过边缘世界生成网络提高图像检测性能。
-
公开(公告)号:CN116978115A
公开(公告)日:2023-10-31
申请号:CN202310739037.5
申请日:2023-06-21
Applicant: 安徽大学
IPC: G06V40/20 , G06V40/16 , G06V20/40 , G06V10/25 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G10L15/25
Abstract: 本发明公开了一种基于部分卷积和多尺度特征提取的唇语识别方法,包括以下步骤:S1:获取单词级唇语识别视频数据集,并对每个视频进行人脸关键点检测;S2:对唇语识别数据集进行预处理,得到裁剪后的连续灰度化的唇语视频序列;S3:将预处理后的数据集中的数据进行划分;S4:对训练集数据使用水平翻转、Mixup、时间掩蔽、随机切除等数据增强方法;S5:对训练集中的数据进行短期时序特征提取和空间特征提取;S6:采用Res2‑TCN网络对唇语识别数据集的短期和长期时序特征进行提取;S7:将用于结果分类的序列输入到全连接层进行分类;S8:根据唇语识别的结果计算模型的损失。本发明可以保证模型在计算量非常小的情况下能实现更准确的唇语识别。
-
-
-
-
-
-
-
-
-