-
公开(公告)号:CN115619827A
公开(公告)日:2023-01-17
申请号:CN202211304713.8
申请日:2022-10-24
Applicant: 河南大学
IPC: G06T7/246 , G06T7/73 , G06V10/77 , G06V10/80 , G06V10/82 , G06V10/74 , G06N3/0464 , G06N3/0442 , G06N3/049
Abstract: 本发明提出了一种基于Transformer和时空记忆的多目标跟踪方法,其步骤为:首先,利用连续四帧视频图像进行提取特征信息;并将四帧的特征信息融合获取高质量富含时空信息的特征;其次,将某一时间窗口内所有行人信息存储的动态时空记忆模块中,并与当前视频图像目标进行外观相似度和距离得分的计算;最后外观相似度得分和距离得分融合得到最终得分,利用最终得分预测目标轨迹。本发明能在相机移动、行人快速移动等情况下精准定位行人位置,采用动态时空记忆模块消除形变的影响,利用外观相似度和距离融合得分预测目标轨迹,解决了长距离遮挡的问题,获得精准的目标轨迹。
-
公开(公告)号:CN117788517A
公开(公告)日:2024-03-29
申请号:CN202311776204.X
申请日:2023-12-22
Applicant: 河南大学
Abstract: 本发明属于视频场景分析处理技术领域,公开一种基于级联跟踪算法的多目标跟踪方法,具体步骤如下:首先,使用目标检测网络提取目标检测框的信息;其次,根据检测框的面积大小将所有检测目标和轨迹分组,不同分组内的目标和轨迹依赖重合度关联,未关联的目标和轨迹进入下一轮分组关联。本发明采用压缩自解码器解决了单个目标存在多个检测框的问题,并采用任务感知协作模块获取较精准的检测框位置,最后根据检测框的面积进行分组,实现了更准确的目标轨迹跟踪。
-
公开(公告)号:CN118748020A
公开(公告)日:2024-10-08
申请号:CN202311179332.6
申请日:2023-09-13
Applicant: 河南大学
IPC: G10L21/0216 , G10L17/04 , G10L15/06 , G10L25/27
Abstract: 本发明提出了一种基于改进Transformer构建多任务学习的水下噪声识别方法,步骤如下:对采集到的噪声信号进行标准化处理;对标准化后的噪声数据进行重叠采样,并按比例划分为训练集、验证集和测试集;以Transformer为骨干网络,构建基于多任务学习的水下噪声识别模型;确定水下噪声识别模型中噪声种类识别任务和噪声来源识别任务的权重关系;将训练集和验证集输入水下噪声识别模型中进行训练;将实际采集到的原始数据经过标准化处理后输入训练好的水下噪声识别模型中进行分类,得到噪声类型和传感器来源。本发明可以同时实现多个任务,并且在特征学习过程中噪声来源识别可以为噪声种类识别提供正则化和隐式数据扩充,达到提高噪声类型识别的精度。
-
-