基于层次化上下文引导的多目标跟踪方法

    公开(公告)号:CN116245913A

    公开(公告)日:2023-06-09

    申请号:CN202310117211.2

    申请日:2023-01-30

    Abstract: 本发明提供一种基于层次化上下文引导的多目标跟踪方法,并提出了一种新的分层上下文引导网络,该网络通过分层地视频帧全局处理、局部处理和对象包围框处理来执行检测、包围框特征提取和对象位置细化。该跟踪器分别以全局和局部的方式学习视频帧的时间和空间上下文特征,引导多尺度特征聚合,从而定位感兴趣的区域,提取丰富的包围框特征。这样,每个检测的包围框除了语义信息外,还包含上下文关系信息,减少了不完整或不清楚的对象的重要信息的丢失。基于学习到的上下文特征,设计了一个上下文引导的对象位置细化模块,通过传播对象在每一帧的包围框特征来学习目标对象轨迹片段的代表性特征,并根据代表性特征生成位置细化后的对象。

    一种基于多模态特征对齐的视觉定位方法

    公开(公告)号:CN117934803A

    公开(公告)日:2024-04-26

    申请号:CN202410126014.1

    申请日:2024-01-30

    Abstract: 本发明提供了一种基于多模态特征对齐的视觉定位方法。该方法包括:将图片和对应的指称表达输入到特征提取模块中,分别提取多尺度的网格特征和文本特征,利用Deformable DETR模型和网格特征生成区域特征;将文本特征、区域特征连接后输入到Transformer编码器中生成可学习token;将文本特征和网格特征通过缩放点积注意力操作得到多模态特征;根据多模态特征和可学习token进行目标分割掩码的预测处理,得到预测掩码并将其作为输入数据的视觉定位结果。本发明方法解决了网格特征缺乏对象级信息的问题,增强了特征表示,有效提升了在复杂查询或复杂图片场景下的分割性能。利用混合操作融合全局和局部特征,丰富了多模态特征,有效地实现语义对齐。

    一种基于反向注意力网络的单目标跟踪方法

    公开(公告)号:CN117853531A

    公开(公告)日:2024-04-09

    申请号:CN202410036684.4

    申请日:2024-01-10

    Abstract: 本发明提供了一种基于反向注意力网络的单目标跟踪方法。该方法包括:标记视频数据第一帧中的包含跟踪目标位置的边界框,将边界框图像区域作为模板图像,根据模板图像获取下一帧中的搜索域图像;将模板图像和搜索域图像输入到特征提取网络,特征提取网络将模板图像和搜索域图像从三通道彩色图像转化为多通道特征,输出模板特征和搜索域特征;将模板特征和搜索域特征输入堆叠的反向注意力模型,反向注意力模型输出优化后的模板特征和搜索域特征,预测分支根据优化后的模板特征和搜索域特征输出当前帧中的目标位置。本发明方法能够实现抑制模板和搜索域中非目标特征的目标,从而提高模型对目标特征的感知精度以及目标跟踪算法的准确度。

    一种基于数据增强的小样本学习方法

    公开(公告)号:CN117853867A

    公开(公告)日:2024-04-09

    申请号:CN202410022359.2

    申请日:2024-01-05

    Abstract: 本发明提供了一种基于数据增强的小样本学习方法。该方法包括:通过RotMix模块和RotCom模块对源数据进行数据增强处理,将增强后的数据传输给MixNet模型;MixNet模型通过特征提取模块、类别多样性编码模块对增强后的数据集进行特征提取与编码,得到特征表示;MixNet模型通过对比学习模块对所述特征表示进行对比学习,得到优化后的特征表示,通过比较不同样本对的特征表示,优化MixNet模型的区分能力;将优化后的特征表示转换为源数据的分类结果,并进行展示。本发明方法从数据增强开始,通过RotMix和RotCom引入多样性和复杂性,再经由MixNet模型进行深度特征提取和类别多样性编码。对比学习模块进一步优化了模型的区分能力。最终将处理结果以用户友好的方式呈现。

    一种时钟恢复方法及装置

    公开(公告)号:CN107528658A

    公开(公告)日:2017-12-29

    申请号:CN201710652017.9

    申请日:2017-08-02

    CPC classification number: H04J3/0617 H04L7/0037

    Abstract: 本公开是关于一种时钟恢复方法及装置。该方法包括:确定被测信号中当前分析点之前的跳变点;根据当前分析点的标识、跳变点的标识以及当前分析点所在周期的采样点的一半,计算出当前延迟点数;计算当前延迟点数与存储的前一次计算得到的延迟点数的差值,得到当前相位增量;根据当前相位增量对当前分析点进行调整,将调整后的分析点作为新的当前分析点;比较当前相位增量与存储的前预设次数计算得到的相位增量,当相同时,结束时钟恢复操作;当不同时,根据新的当前分析点重复进行上述时钟恢复的步骤。该技术方案消除了硬件设备对时钟恢复准确度的影响,提高了时钟恢复结果的准确度,完全采用软件实现,大大降低了成本,时钟恢复的速度较快。

    一种基于时空特征增强网络的视频人体行为识别方法

    公开(公告)号:CN116912727A

    公开(公告)日:2023-10-20

    申请号:CN202310669142.6

    申请日:2023-06-07

    Abstract: 本发明提供了一种基于时空特征增强网络的视频人体行为识别方法。该方法包括:将训练视频数据的帧图像输入到视频人体行为识别模型中,通过局部时空特征增强模块提取出帧图像中的帧级别运动的局部时空特征,利用全局时空特征增强模块获取帧图像中的视频级运动的全局时空特征,通过多特征融合模块融合局部时空特征和全局时空特征,将得到的最终的特征表示输入到全连接层,全连接层输出视频数据中的人体行为识别结果;当重复执行上述处理过程迭代训练视频人体行为识别模型达到设定次数后,得到训练好的视频人体行为识别模型,利用训练好的视频人体行为识别模型对待检测的视频数据进行人体行为识别。本发明方法可以高效地从视频中识别出行人的行为。

Patent Agency Ranking