-
公开(公告)号:CN114494349B
公开(公告)日:2024-07-26
申请号:CN202210099782.3
申请日:2022-01-27
Applicant: 上海交通大学
IPC: G06T7/246 , G06T7/73 , G06N3/0464 , G06N3/082
Abstract: 一种基于目标特征时空对齐的视频跟踪系统及方法,包括:全局特征提取模块、目标位置预测模块、目标特征提取模块和目标跟踪模块,本发明充分利用目标间的位置关系和前后帧目标的运动特征,并增强不同目标之间的区分度,筛选出最有代表性的目标特征,在视频跟踪时能更为准确地预测和区分目标,可以更加精准地匹配前后帧目标,增强物体类别预测的稳定性。
-
公开(公告)号:CN110070025B
公开(公告)日:2023-03-31
申请号:CN201910306845.6
申请日:2019-04-17
Applicant: 上海交通大学
Abstract: 一种基于单目图像的三维目标检测系统及方法,将三维目标检测转化到二维图像下的预测,然后应用摄像头标定参数将二维映射到摄像头三维坐标系下,重构出目标的三维目标框,通过对映射出的三维目标框进行进一步修正,得到精确的三维目标框,经两步法训练后进行精确三维目标检测,本发明低成本,高效,具有广泛的实际应用价值。
-
公开(公告)号:CN114818848A
公开(公告)日:2022-07-29
申请号:CN202210216953.6
申请日:2022-03-07
Applicant: 上海交通大学
IPC: G06K9/62 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 一种基于图像块组合的高分辨率图像目标检测加速方法,在离线阶段从高分辨率图像中提取出图像块序列后,将①图像块序列作为状态、②图像块排列方式为动作、③合成的子图的目标检测准确率作为奖励,使用强化学习的方法训练策略网络;在在线阶段通过训练后的策略网络,根据输入的图像块序列得到对应的组合策略,并基于该组合策略合成子图,将目标检测得到结果后通过映射回原图实现加速检测。本发明减少了目标检测算法的运行次数,在加快算法运行速度的同时保证目标检测的准确率保持在较高水平。
-
公开(公告)号:CN114120191A
公开(公告)日:2022-03-01
申请号:CN202111390861.1
申请日:2021-11-23
Applicant: 上海交通大学
Abstract: 一种基于多层级对比学习的自监督视频特征学习的视频行为识别系统及方法,包括:三维残差卷积神经网络以及分别与之相连的三个时域信息提取模块及其对应的低、中、高语义特征对比损失模块,其中:三维残差卷积神经网络分别输出低、中、高层语义特征至各个时域信息提取模块、输出对应层级的特征至各个语义特征对比损失模块;每个时域信息提取模块均包含时域信息对比损失单元和及时域检索损失单元并传递对应的低、中、高层时域信息。本发明在使用深度网络进行自监督视频特征学习时,利用深度网络提取的低、中、高层级特征,结合轻量的特征级时域特征增广方式,分别使用对应于不同层级的对比学习损失,并进行结合以提高自监督学习的视频特征的表征能力和泛化性。
-
公开(公告)号:CN108520203B
公开(公告)日:2021-08-20
申请号:CN201810212726.X
申请日:2018-03-15
Applicant: 上海交通大学
Abstract: 一种基于融合自适应多外围框与十字池化特征的多目标特征提取方法,以连续帧图像作为训练数据,针对其中每一帧图像中的目标分别提取三层多外围框的特征并进行自适应去除噪声的特征加权,接着对特征进行十字池化噪声去除,最后将自适应多外围框与十字池化特征联合并进行端到端训练,最后将训练后的目标检测器进行测试。本发明利用卷积神经网络架构,通过三元组损失函数优化特征,使相同的目标之间的特征相似度更强,不同的目标之间的特征相似度更弱,即使在视频帧中出现目标之间表观相似、检测框不准确、目标姿态变化等一系列情况,最终依旧能够达到优越的效果同时保持速度快速。
-
公开(公告)号:CN111641830A
公开(公告)日:2020-09-08
申请号:CN201910157792.6
申请日:2019-03-02
Applicant: 上海交通大学
IPC: H04N19/137 , H04N19/13 , H04N19/463 , H04N19/103 , H04N19/109 , H04N19/503 , H04N19/513 , H04N19/91
Abstract: 一种用于视频中的人体骨架的多模态无损压缩实现方法,通过选取关键帧并对视频中的每一帧中的各个人体骨架区分是否为变化的人体骨架,然后对变化的人体骨架进行特殊标记标注,根据每帧图像是否为关键帧以及该帧中各个骨架是否为变化的人体骨架进行选择性编码。本发明通过三种编码方法的相互有机协作结合,对一段视频序列中的人体骨架信息进行无损压缩编码,从而获得可供传输的小体积编码比特流,显著提高了人体骨架信息的压缩效率。
-
公开(公告)号:CN108174225A
公开(公告)日:2018-06-15
申请号:CN201810025778.6
申请日:2018-01-11
Applicant: 上海交通大学
IPC: H04N19/82 , H04N19/117 , H04N19/119 , H04N19/154
Abstract: 一种基于对抗生成网络的视频编解码环路内滤波实现方法及系统,使用视频编解码算法编码并解码得到的视频作为训练数据,使用生成模型和辨别模型联合训练的方法训练一卷积神经网络并得到预训练模型,最后在视频编解码环路内使用所述预训练模型,在视频编解码算法的环路内对每一张重建视频帧进行图像质量恢复,有选择地使用输出图像更新原图像。本发明具有更强的鲁棒性和拓展性,能够处理视频压缩编码后的重建帧,比基于一般传统卷积神经网络的环路内滤波器图像恢复效果更接近原始图像,提升图像质量,进而提升视频压缩编码的效率。
-
公开(公告)号:CN108134932A
公开(公告)日:2018-06-08
申请号:CN201810025957.X
申请日:2018-01-11
Applicant: 上海交通大学
IPC: H04N19/117 , H04N19/80 , H04N19/154 , H04N19/172
Abstract: 一种基于卷积神经网络的视频编解码环路内滤波器及其实现方法,以视频编解码算法编码并解码得到的视频作为训练数据,使用监督学习的方法训练一卷积神经网络并得到预训练模型,然后在视频编解码环路内对每一个重建帧划分为若干个子图,采用所述预训练模型以每一个子图作为输入,输出一张与输入图像大小相同的图像,并根据输出图像的质量提升与否,有选择地使用输出图像更新原图像。本发明能够提升编解码过程中的重建帧的图像质量,并对后续编码过程提供增益,最终提升编码算法的效率。
-
公开(公告)号:CN102281385B
公开(公告)日:2013-03-27
申请号:CN201110234414.7
申请日:2011-08-16
Applicant: 上海交通大学
Abstract: 本发明公开一种基于运动视频的周期运动检测方法,通过对周期运动视频的运动物体进行分析,得到运动部分的运动矢量表;通过对视频中提取出来的运动模式区域进行匹配而实现最佳匹配,从而确定每一帧中的运动模式;运动模式匹配后,通过对运动场景进行分类分别采用基于轨迹和基于区域的方法滤除非周期运动而保留周期运动。最后通过对周期运动进行合格性判断而达到对运动进行计数的目的。本发明具有实时特性,针对不同的运动情形,有效识别率达到了95%,具有良好的应用表现。
-
公开(公告)号:CN102521287A
公开(公告)日:2012-06-27
申请号:CN201110386397.9
申请日:2011-11-28
Applicant: 上海交通大学
Abstract: 本发明提供基于期望模型的图像重排序方法,通过构建一个空间轮廓描述向量来表征用户对于搜索图像轮廓的期望,将该空间轮廓描述向量就作为用户的期望模型。通过对搜索引擎返回的每一张搜索结果图像提取其相应的空间轮廓描述向量,用该空间轮廓描述向量与其对应的用户期望模型进行比较,计算两者之间的相似性。然后将此相似性的值就作为该图片的期望值。期望值越大说明图片越符合用户对于图片轮廓的期望。最后根据期望值的大小进行排序,将期望值较大的排在靠前的位置。本发明有效地提高了图片搜索的准确性,测试显示平均的准确率(AP@40)达到85%。如果结合Jun Huang等人的显著性和一致性模型则可以达到91%的平均搜索准确率。
-
-
-
-
-
-
-
-
-