-
公开(公告)号:CN117793348A
公开(公告)日:2024-03-29
申请号:CN202311802934.2
申请日:2023-12-26
Applicant: 上海交通大学 , 中国电子科技集团有限公司电子科学研究院
IPC: H04N19/124 , H04N19/60 , H04N19/42
Abstract: 一种基于通道粒度变换的图像压缩模型量化方法,在预处理阶段构建全精度浮点图像压缩模型并通过定标数据对模型进行基于通道粒度变换的变换系数求解和变换系数融合的量化前处理优化;在应用阶段对优化后的全精度浮点图像压缩模型进行量化及整型化部署,采用部署后的模型进行图像压缩。本发明能够有效地降低由于量化导致的性能损失,同时控制量化模型的计算复杂度,将浮点图像模型量化为整形图像压缩模型,实现图像压缩模型整型化以保证跨平台编解码一致性。
-
公开(公告)号:CN111259790B
公开(公告)日:2023-06-20
申请号:CN202010042072.8
申请日:2020-01-15
IPC: G06V20/40 , G06V40/20 , G06V10/82 , G06V10/77 , G06N3/0455 , G06N3/0464
Abstract: 一种用于中短时视频的从粗到细的行为快速检测与分类方法及系统,通过对原视频重采样后进行时空联合的特征提取,在此基础上进行时域定位;然后根据时域定位得到的采样特征信息进行目标分类以及粗略定位,根据目标分类得到的行为类别以及行为轨迹的描述参数对粗略定位得到的行为轨迹在关键帧上依次进行修正,得到行为检测结果,从而实现行为目标的快速检测。本发明在有效提升分类精度以及定位精度的同时,还能够确保行为检测的运行效率,目标检测的准确率可以达到79.30%,同时平均每一帧的处理时间仅为7.6毫秒。
-
公开(公告)号:CN113780240A
公开(公告)日:2021-12-10
申请号:CN202111149036.2
申请日:2021-09-29
Applicant: 上海交通大学
Abstract: 一种基于神经网络及旋转特征增强的物体位姿估计方法,构建物体在不同旋转位姿下的先验旋转特征库,针对单目相机采集到的二维视觉图像,通过目标检测得到图像的物体类别、分割区域以及目标的视觉特征;将目标物体的位姿估计解耦为位移参数估计和旋转参数估计,根据图像的物体类别和分割区域,将目标的视觉特征通过位移参数估计后与先验旋转特征库进行匹配实现粗估计,再用目标的视觉特征与对应的先验旋转特征共同估计旋转残差项,实现精细定位。本发明充分利用物体天然蕴含的不同旋转姿态下的特征构建先验旋转特征库,根据输入图像中提取到的视觉特征在特征库中筛选出合适的对应的旋转特征,从粗到细的增强旋转参数估计的鲁棒性、准确性。
-
公开(公告)号:CN108520505B
公开(公告)日:2021-12-03
申请号:CN201810341067.X
申请日:2018-04-17
Applicant: 上海交通大学
IPC: G06T5/10 , G06T9/00 , H04N19/172 , G06N3/04
Abstract: 一种基于多网络联合构建与自适应选择的环路滤波实现方法,首先通过联合构建包含一个多分类网络和多个滤波网络的卷积神经网络,然后采用压缩视频的视频帧作为训练数据对该卷积神经网络进行迭代训练,最后在视频压缩过程中进行自适应选择的环路滤波,即只使用多个滤波网络或其联合分类网络共同实现环路滤波,本发明具有更强鲁棒性,不同模型能够更好地捕捉上述的由压缩算法带来的复杂的图像失真现象,从而实现更好的质环路滤波效果。
-
公开(公告)号:CN108537824B
公开(公告)日:2021-07-16
申请号:CN201810212701.X
申请日:2018-03-15
Applicant: 上海交通大学
Abstract: 一种基于交替反卷积与卷积的特征图增强的图像检测优化方法,通过交替反卷积与卷积进行特征图增强,使用卷积神经网络中不同的层,预测不同尺度的目标,并重新构建用来进行目标分类与回归的预测层,最后经网络训练后得到目标检测器进行图像检测并得到优化后的目标框。通过本发明改进的网络结构,可以很容易移植到主流的目标检测网络架构中,很大程度增强特征,且保留图像中小目标特征,促进检测效果,即使在低分辨率的图像输入条件下,依然取得优异的效果。
-
公开(公告)号:CN108174225B
公开(公告)日:2021-03-26
申请号:CN201810025778.6
申请日:2018-01-11
Applicant: 上海交通大学
IPC: H04N19/82 , H04N19/117 , H04N19/119 , H04N19/154
Abstract: 一种基于对抗生成网络的视频编解码环路内滤波实现方法及系统,使用视频编解码算法编码并解码得到的视频作为训练数据,使用生成模型和辨别模型联合训练的方法训练一卷积神经网络并得到预训练模型,最后在视频编解码环路内使用所述预训练模型,在视频编解码算法的环路内对每一张重建视频帧进行图像质量恢复,有选择地使用输出图像更新原图像。本发明具有更强的鲁棒性和拓展性,能够处理视频压缩编码后的重建帧,比基于一般传统卷积神经网络的环路内滤波器图像恢复效果更接近原始图像,提升图像质量,进而提升视频压缩编码的效率。
-
公开(公告)号:CN111325073A
公开(公告)日:2020-06-23
申请号:CN201811541700.6
申请日:2018-12-17
Applicant: 上海交通大学
IPC: G06K9/00
Abstract: 一种基于运动信息聚类的监控视频异常行为检测方法,从视频中每次提取出不重叠的连续帧,针对该连续帧计算光流幅度图像并进行预处理,计算预处理后的二值化图像中的有效连通区域并对其进行矫正和去除噪声,将得到的目标检测结果进行行为识别,最终得到异常行为检测结果。本发明利用光流幅度图像得到视频中的运动信息进行对图像初步的行为定位,利用目标检测器剔除由光流幅度图像得到的运动区域中的噪声,保证得到的运动区域内包含人,这使得行为识别网络的识别对象更有针对性,使不同场景的监控视频都可以实现非常高的检测精度和非常低的误检率。
-
公开(公告)号:CN110688918A
公开(公告)日:2020-01-14
申请号:CN201910867364.2
申请日:2019-09-12
Abstract: 一种基于长时增强特征增强及稀疏动态采样的快速行为检测方法,对视频直接进行时空联合的三维特征提取后进行时域检测,利用全局的长时信息对三维特征进行长时增强,根据时域检测结果对长时增强的特征沿时间维度在时域区间内进行稀疏动态采样,得到空间检测结果后与时域检测结果相结合,利用每个特征向量及其偏移向量计算检测框的相似度并通过逐帧聚类的方法实现检测框的链接,得到的检测框的集合,即行为管道。本发明能够显著提升分类精度以及定位精度从而最终有效提升检测的准确率,同时能够提升视频行为检测的运行效率。
-
公开(公告)号:CN110070025A
公开(公告)日:2019-07-30
申请号:CN201910306845.6
申请日:2019-04-17
Applicant: 上海交通大学
Abstract: 一种基于单目图像的三维目标检测系统及方法,将三维目标检测转化到二维图像下的预测,然后应用摄像头标定参数将二维映射到摄像头三维坐标系下,重构出目标的三维目标框,通过对映射出的三维目标框进行进一步修正,得到精确的三维目标框,经两步法训练后进行精确三维目标检测,本发明低成本,高效,具有广泛的实际应用价值。
-
公开(公告)号:CN109977797A
公开(公告)日:2019-07-05
申请号:CN201910167340.6
申请日:2019-03-06
Applicant: 上海交通大学
Abstract: 一种基于排序损失函数的一阶目标检测器的优化方法,首先在二维图像上预定义密集的检测框,根据检测框与目标框的交并比为每个检测框分配标签,并将待检测图片输入一阶目标检测器,得到每个检测框中的目标置信度分数和精确框的预测,通过基于误差驱动的更新方法对一阶目标检测器进行训练,从而实现检测器的优化检测。本发明解决了检测器训练中正负样本不均衡的问题,且具有出色的泛化性能,所采用的更新算法能够应对目标函数不连续的特性,且在非凸条件下也有出色的优化效果。优化后的目标检测器能够不依赖于特定参数的选取,在COCO目标检测数据集上达到42.1mAP的检测效果。
-
-
-
-
-
-
-
-
-