基于拓扑结构特征关联的高精度视频文字跟踪方法与装置

    公开(公告)号:CN118366143A

    公开(公告)日:2024-07-19

    申请号:CN202410489150.7

    申请日:2024-04-23

    Abstract: 本发明公开一种基于拓扑结构特征关联的视频文字跟踪方法:先利用文本检测器针对视频帧生成高召回的文本检测框,再基于三阶段匹配的关联策略进行前后帧文本实例之间的特征匹配,最终生成视频中包含同一文本目标位置信息和身份信息的所有轨迹。将文本检测结果划分为高分框和低分框并先后同未配对轨迹进行第一、第二阶段的数据关联匹配,再针对第二阶段的中断轨迹利用局部搜索跟踪器参考历史轨迹文本特征以进行断点处遗漏文本框的局部搜索,在第三阶段进行局部搜索文本与未配对轨迹的数据关联匹配。该方法准确高效,在多个主流的视频文字跟踪基准上实现了最佳的跟踪精度及可观效率。本发明还提供了相应的基于拓扑结构特征关联的视频文字跟踪装置。

Patent Agency Ranking