-
公开(公告)号:CN115830300A
公开(公告)日:2023-03-21
申请号:CN202211481710.1
申请日:2022-11-24
Applicant: 华中科技大学
IPC: G06V10/22 , G06V10/40 , G06V10/75 , G06V10/774
Abstract: 本发明公开了一种引入早期检测器的Transformer目标检测方法,包括:将图像输入到视觉Transformer,提取出语义丰富的特征图;在该特征图上使用早期检测器,输出粗略的估计目标;取出置信度前N个估计目标,将该目标的检测框的四个坐标作为检测Transformer中解码器的参考点,并将预测出这些选定的估计目标的特征图上的特征点选定作为检测Transformer中解码器的目标标识符;所述N为预设值;检测Transformer的解码器利用步骤三提供的参考点和目标标识符,利用交叉注意力机制与步骤一提取出的特征图进行交互,从而不断精炼目标标识符和参考点的坐标,最终输出准确的目标检测框和目标类别。本发明还提供了相应的引入早期检测器的Transformer目标检测装置。
-
公开(公告)号:CN117876845A
公开(公告)日:2024-04-12
申请号:CN202410057263.X
申请日:2024-01-15
Applicant: 华中科技大学
IPC: G06V10/82 , G06V10/764 , G06N3/0455 , G06N3/082 , G06N3/048 , G06N3/0499 , G06V10/26
Abstract: 本发明公开了一种基于双向状态空间模型的视觉表征方法——Vision Mamba(Vim)。Vim模型首先将输入图像分割为一系列图像块,并将其线性投影为向量序列输入至Vim模块中进行高效序列建模。该方法首次将状态空间模型Mamba应用于计算机视觉领域,并引入双向的状态空间建模方法来优化模型在处理视觉数据时缺乏全局视觉的问题,同时利用位置嵌入提供空间信息的位置感知能力,使模型在诸如语义分割、目标检测和实例分割等密集预测任务中表现更稳健。此外,得益于Mamba算法的高效设计,Vim具有次二次时间复杂度计算特性及线性内存复杂度,相较于基于Transformer结构的视觉模型有着明显的效率优势。本发明还提供了相应的基于双向状态空间模型的视觉表征装置。
-
公开(公告)号:CN118397375A
公开(公告)日:2024-07-26
申请号:CN202410664140.2
申请日:2024-05-27
Applicant: 华中科技大学
IPC: G06V10/764 , G06V10/82 , G06V10/42 , G06V10/44 , G06V10/80 , G06N3/0442 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了一种基于门控线性注意力机制的图像分类识别方法:(1)图像嵌入处理,包括以下子步骤:(1.1)将图像分块,铺平展开为图像序列;(1.2)将图像序列输入到图像序列嵌入层中去,处理得到图像特征序列;(2)将图像特征序列输入到由ViG基本处理单元堆叠构建成的图像基础处理网络得到新的图像特征序列;(3)将新的图像特征序列输入到池化层进行平均池化,将平均池化后的特征输入到线性层进行图片的类别预测。所提出的方法在分类数据集ImageNet及各种下游任务上表现出优越的精度、参数和FLOPs的权衡,显著优于当前流行的Transformer和CNN模型。本发明还提供了相应的于门控线性注意力机制的图像分类识别装置。
-
公开(公告)号:CN115861386A
公开(公告)日:2023-03-28
申请号:CN202211588069.1
申请日:2022-12-12
Applicant: 华中科技大学
IPC: G06T7/292 , G06T7/223 , G06T7/246 , G06V20/17 , G06V10/74 , G06V10/82 , G06N5/04 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种通过分而治之关联的无人机多目标跟踪方法:将连续两帧图像和前一帧的运动查询热图输入到主干网中,同时预测当前帧目标的位置,外观特征以及目标在相邻帧间的运动;设计对跟踪过程中的在线轨迹和丢失轨迹进行分而治之的目标关联算法,利用运动信息对在线轨迹与检测目标进行相邻帧的关联,利用外观特征对丢失轨迹和检测目标进行跨多帧的关联;为确保位置关联的可靠性,使用预测目标中心点运动计算当前帧目标边界框在前一帧中的估计位置并与前一帧跟踪的轨迹边界框进行交并比相似度计算(运动匹配);本发明在在图像分辨率为608×1088的情况下,可以以实时速度运行。本发明还提供了相应的通过分而治之关联的无人机多目标跟踪装置。
-
-
-