一种基于时空场景连通图的开放词汇多目标跟踪方法

    公开(公告)号:CN119963605A

    公开(公告)日:2025-05-09

    申请号:CN202510150262.4

    申请日:2025-02-11

    Applicant: 厦门大学

    Abstract: 一种基于时空场景连通图的开放词汇多目标跟踪方法,涉及计算机视觉技术。A.给定训练数据集,包含视频序列和对象的相关状态信息。B.将视频帧序列输入预训练的检测器,提取视频帧的特征,并生成每帧中的对象候选框。C.根据生成的候选框,从全局特征图中利用ROI池化操作提取每个候选框对应的局部特征。D.将提取的ROI区域特征输入解码器,通过多头自注意力提取目标间的各种关系。E.将获得的关键帧与参考帧的关系输入连接头,得到关联预测结果,产生图关联损失。F.将关键帧与参考帧中经过解码器处理的ROI特征计算外观相似度,得到关联预测,得到外观关联损失与步骤E产生的图关联损失共同组成网络的损失函数。提升跟踪性能。

Patent Agency Ranking