-
公开(公告)号:CN118840375A
公开(公告)日:2024-10-25
申请号:CN202410887857.3
申请日:2024-07-03
Applicant: 湖南大学
IPC: G06T7/10 , G06T7/246 , G06T7/215 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及动态目标分割方法、装置、介质、设备及程序产品,获取点云数据并构建数据集,将设定数量的过去帧点云的视角转换到当前帧视角并进行叠加聚合,得到包含时空信息的4D点云集合;得到的4D点云集合,利用U‑Net结构的编码器‑解码器结构,进行深层次的特征提取,编码器‑解码器结构分别包括具有5级块深度的编码器以及4级块深度的解码器,每个块分别包括基于三维卷积进行的条件位置编码、层归一化、强时空特征耦合的状态空间模型、层归一化和多层感知机;最后一级解码器的结果通过线性层,得到与初始点云集合各点对应的动态目标分割结果。
-
公开(公告)号:CN117711017A
公开(公告)日:2024-03-15
申请号:CN202311654384.4
申请日:2023-12-05
Applicant: 湖南大学
IPC: G06V40/10 , G06V10/764 , G06V10/762
Abstract: 本申请公开了一种性别信息增强的实时行人重识别方法、系统及电子设备,属于行人重识别技术领域,该方法通过性别分类模型来预测行人粗糙性别信息,再通过少数服从多数的投票机制校正粗糙性别信息以得到高质量性别预测信息,并基于高质量性别预测信息提出了一种聚类精炼策略,根据簇中具有预测男性标签的行人个数和具有预测女性标签的行人个数,对簇中性别不一致的样本进行剔除或者对簇进行分裂操作得到新簇。本发明可以提升聚类效果,提高伪标签质量,以及增强模型的行人重识别性能。
-
公开(公告)号:CN116012739A
公开(公告)日:2023-04-25
申请号:CN202310050734.X
申请日:2023-02-01
Applicant: 湖南大学
IPC: G06V20/17 , G06T5/00 , G06V10/774 , G06V10/82 , G06N3/08 , G06T7/33 , G06N3/094 , G06N3/0464
Abstract: 本发明提供一种基于对抗学习与对比学习的无人机遥感视频盲去运动模糊方法,其特征模型ALCLDeblur包括1个带有CAM注意力机制的生成器,1个带有CAM注意力机制的判别器,1个配准器。方法包括:采集数据,构建多组无人机遥感图像的模糊图像‑清晰图像对(x,y),形成训练数据集;训练模型,根据训练数据集训练特征模型ALCLDeblur;测试模型,将待处理的无人机遥感视频的模糊图像输入训练好的生成器得到对应的去模糊图像。生成器包括生成器CAM注意力层,判别器包括判别器CAM注意力层,主要解决在生成去模糊图像时聚焦不准、生成质量差的问题。配准器提取图像的形状与色域分布信息,得到生成图像与原图的差异,指导生成器在生成过程中保留图像的空间与色域信息,提高生成图像质量。最后通过生成对抗损失、配准器对比损失以及身份内容损失来优化网络模型。
-
公开(公告)号:CN117058375A
公开(公告)日:2023-11-14
申请号:CN202310956765.1
申请日:2023-08-01
Applicant: 湖南大学
IPC: G06V10/26 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种特征融合网络交互式图像分割方法、电子设备及存储介质,该方法针对现有IIS任务中因特征交互不充分而引起的融合特征特异性差的问题,提出了一种基于CNNs与注意力机制的点击与图像融合框架,其能够在使得点击与图像交互得更加充分的同时生成特征特异性更强的视觉特征图。针对IIS任务中普遍存在的像素不平衡问题,定义了这种问题并基于现有损失理论以及IIS任务的实际需求提出了一种名为Balanced normalized focal loss的损失,通过加入平衡权重有效的控制正点击像素以及负点击像素的梯度质心区域占比来调整模型训练过程中存在的像素不平衡问题。
-
公开(公告)号:CN116842566A
公开(公告)日:2023-10-03
申请号:CN202310823924.0
申请日:2023-07-06
Applicant: 湖南大学
IPC: G06F21/62 , G06V10/44 , G06V10/774 , G06T9/00 , G06V10/82 , G06N3/045 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种个人图像隐私保护方法、系统及电子设备。本发明提供的方法允许用户通过语言表达来指定保护图像中的某个人,通过使用轻量级深度神经网络对输入指代信息和个人图像进行并行编码,生成图像与文本信息充分融合的多尺度视觉特征,在解码过程中,通过多尺度特征融合和掩码定位增强模块,生成稳定的指定个人隐私保护图像掩码,此外,引入平衡二元交叉熵损失来解决训练中的像素不平衡问题,优化网络性能,提高个人图像隐私保护效果。本发明可以解决现有个人图像隐私保护技术中存在内容过度保护以及指代个人图像隐私保护网络在训练中存在的像素不平衡问题。
-
公开(公告)号:CN116681984A
公开(公告)日:2023-09-01
申请号:CN202310650787.5
申请日:2023-06-05
Applicant: 湖南大学
IPC: G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/08 , G06N3/048 , G06V10/40 , G06V10/764
Abstract: 本申请提供一种基于红外‑可见光信息融合的目标检测方法,通过设置的ISF‑Net网络对可见光和红外特征进行训练,能够有效的学习两种模态的共同特征和差异特征,利用特征分离损失监督训练的过程,使两种模态共同特征中的分歧最小化,差异特征中的分歧最大化,然后利用利用通道注意分支和空间注意分支将共同特征和差异特征进行增强,突出共同特征和差异特征之间的差异,有效提高了融合特征的特征表达能力,使得模型具有较高的检测精度。本申请还提供一种基于红外‑可见光信息融合的目标检测系统。
-
公开(公告)号:CN116152265A
公开(公告)日:2023-05-23
申请号:CN202310012997.1
申请日:2023-01-05
Applicant: 湖南大学
Abstract: 本发明公开了一种基于多尺度特征选择性融合的指代分割方法,考虑到在指代分割的实际应用中,多模态特征之间的难对齐、难充分交互以及背景特征难抑制的问题没有得到有效解决,造成定位不准和模型精度降低的问题,本发明设计了基于文本引导的融合模块,对解码器的浅层到深层进行多尺度特征选择,初步选择出符合文本内容的特征,通过二次选择机制进一步筛选出只包含目标的视觉特征,并且在此基础上我们设计了注意力对比损失函数,它可以有效地抑制背景特征,提高模型精度,通过后处理分割模块,根据图像分割特性,使用不同的采样率对模型进行全局建模,分割得到最终结果,通过基准数据集的验证,本发明能够较大程度提高分割精度。
-
-
-
-
-
-