-
公开(公告)号:CN119006525A
公开(公告)日:2024-11-22
申请号:CN202411213892.3
申请日:2024-08-31
Applicant: 桂林电子科技大学 , 广西产研院时空信息技术研究所有限公司
IPC: G06T7/246 , G06T3/4007 , G06V10/44 , G06N3/0464 , G06V10/74 , G06N3/048 , G06V10/42 , G06V10/80
Abstract: 本发明涉及计算机视觉技术领域,具体涉及一种结合三维注意力和金字塔解码器的目标追踪方法。首先使用优化后的VGG‑16作为骨干网络,以提高特征提取的效率和质量;其次采用三维注意力,不仅增强了对关键特征的提取能力,还实现了对目标关注区域的动态优化;然后使用深层语义融合模块,通过将深层语义特征上采样融合进浅层语义中,以达到对特征的精确表达;最后设计金字塔解码器提升模型在复杂场景下的鲁棒性,使得模型在复杂场景下能够精准的定位和目标追踪。本发明通过对背景信息的有效抑制和目标特征的精细捕捉,该方法能够在高度干扰的环境中准确识别并锁定追踪目标。