-
公开(公告)号:CN116452931A
公开(公告)日:2023-07-18
申请号:CN202310382755.1
申请日:2023-04-11
Applicant: 北京科技大学
IPC: G06V10/80 , G06V10/82 , G06V10/762
Abstract: 本发明公开了一种层级敏感的图像特征聚合方法,包括:在Transformer网络中加入局部自适应特征聚合模块和语义信息聚合模块,构建出层次结构敏感的特征聚合框架;其中,所述特征聚合框架包括三次特征聚合过程,且在三次特征聚合过程中分别采用了不同的聚合方案;将待处理的图像输入所述特征聚合框架中进行特征聚合,得到特征图像。本发明可使Transformer建立更准确的全局关系,并在图像分类、目标检测、语义分割等多个任务上取得更好的效果。
-
公开(公告)号:CN118115913B
公开(公告)日:2024-09-27
申请号:CN202410204210.6
申请日:2024-02-23
Applicant: 北京科技大学
IPC: G06V20/40 , G06V10/62 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及深度学习计算机视觉领域目标追踪领域,特别是指一种两阶段追踪方法及装置,方法包括:获取待进行目标追踪的视频数据,根据视频数据获取图像对;构建基础追踪模型,采用双向视觉引导训练方法、视频序列微调方法以及目标层级的随机擦除数据增强方法,对基础追踪模型进行训练,得到训练好的追踪模型;根据图像对以及训练好的追踪模型,得到目标追踪结果。本发明提出了一种两阶段的训练方式,能够在有效利用视频序列信息的同时不增加任何推理成本。除此之外,本发明提出了一种目标层级的随机擦除数据增强方案,能够很好模拟在追踪过程中出现的遮挡问题,使训练的追踪器更加鲁棒。
-
公开(公告)号:CN116452931B
公开(公告)日:2024-03-19
申请号:CN202310382755.1
申请日:2023-04-11
Applicant: 北京科技大学
IPC: G06V10/80 , G06V10/82 , G06V10/762
Abstract: 本发明公开了一种层级敏感的图像特征聚合方法,包括:在Transformer网络中加入局部自适应特征聚合模块和语义信息聚合模块,构建出层次结构敏感的特征聚合框架;其中,所述特征聚合框架包括三次特征聚合过程,且在三次特征聚合过程中分别采用了不同的聚合方案;将待处理的图像输入所述特征聚合框架中进行特征聚合,得到特征图像。本发明可使Transformer建立更准确的全局关系,并在图像分类、目标检测、语义分割等多个任务上取得更好的效果。
-
公开(公告)号:CN118115913A
公开(公告)日:2024-05-31
申请号:CN202410204210.6
申请日:2024-02-23
Applicant: 北京科技大学
IPC: G06V20/40 , G06V10/62 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及深度学习计算机视觉领域目标追踪领域,特别是指一种两阶段追踪方法及装置,方法包括:获取待进行目标追踪的视频数据,根据视频数据获取图像对;构建基础追踪模型,采用双向视觉引导训练方法、视频序列微调方法以及目标层级的随机擦除数据增强方法,对基础追踪模型进行训练,得到训练好的追踪模型;根据图像对以及训练好的追踪模型,得到目标追踪结果。本发明提出了一种两阶段的训练方式,能够在有效利用视频序列信息的同时不增加任何推理成本。除此之外,本发明提出了一种目标层级的随机擦除数据增强方案,能够很好模拟在追踪过程中出现的遮挡问题,使训练的追踪器更加鲁棒。
-
-
-