-
公开(公告)号:CN109996071B
公开(公告)日:2020-03-27
申请号:CN201910240535.9
申请日:2019-03-27
Applicant: 上海交通大学
IPC: H04N19/124 , H04N19/13 , H04N19/147
Abstract: 本发明公开了一种基于深度学习的可变码率图像编码系统及方法,包括:正向多尺度分解变换网络模块,将输入原始图像分解为多个尺度的图像特征;量化模块,将图像特征量化成整数;自适应码率分配模块,根据给定的目标码率对量化成整数的图像特征进行块级别的码率分配;熵编解码模块,将进行码率分配后的图像特征编码为二进制码流;同时提供了一种可变码率图像解码系统及方法,用于解码上述编码系统及方法形成的编码。本发明使用深度卷积神经网络构建正反多尺度分解变换,利用大量数据进行训练得到最优模型参数,结合基于图像复杂度的自适应码率分配方法,在实际应用中可实现可变码率图像编解码。
-
公开(公告)号:CN107679465B
公开(公告)日:2019-11-15
申请号:CN201710857752.3
申请日:2017-09-20
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于生成网络的行人重识别数据生成和扩充方法,步骤为:利用视频预测网络生成新的行人视频帧样本。利用深度生成对抗网络进行端到端的行人背景变换数据生成。利用不同的数据生成方法进行行人数据集的广度和丰富性的扩充。将扩充的数据集送入特征提取网络中提取特征并用欧氏距离评估性能。本方法同时考虑了行人的类内和类间数据扩充,联合利用了不同的生成网络生成更多更丰富的样本,扩充的数据集具有很好的多样性和鲁棒性,能更好的解决与适应由于样本数量不足和背景干扰带来的性能损失,具有普遍的适用性,扩充的数据集在下一步的行人识别中能发挥更好的性能及效率。
-
公开(公告)号:CN109815911A
公开(公告)日:2019-05-28
申请号:CN201910078362.5
申请日:2019-01-26
Applicant: 上海交通大学
Abstract: 本发明提供过了一种基于深度融合网络的视频运动物体检测系统,包括:视频特征提取模块,接收视频序列输入,对视频内容进行特征提取,得到视频中关于场景信息的特征表达,即视频场景特征表达,并发送至深度融合模块;基础结果检测模块,接收视频序列输入,利用基础检测子对运动物体进行检测,得到相应的基础检测结果,并发送至深度融合模块;深度融合模块,接收视频场景特征表达和基础检测结果,利用深度神经网络进行最优融合,输出最终的检测结果。同时提供了一种视频运动物体检测方法、终端。本发明能够取得高准确度的检测结果。
-
公开(公告)号:CN107679465A
公开(公告)日:2018-02-09
申请号:CN201710857752.3
申请日:2017-09-20
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于生成网络的行人重识别数据生成和扩充方法,步骤为:利用视频预测网络生成新的行人视频帧样本。利用深度生成对抗网络进行端到端的行人背景变换数据生成。利用不同的数据生成方法进行行人数据集的广度和丰富性的扩充。将扩充的数据集送入特征提取网络中提取特征并用欧氏距离评估性能。本方法同时考虑了行人的类内和类间数据扩充,联合利用了不同的生成网络生成更多更丰富的样本,扩充的数据集具有很好的多样性和鲁棒性,能更好的解决与适应由于样本数量不足和背景干扰带来的性能损失,具有普遍的适用性,扩充的数据集在下一步的行人识别中能发挥更好的性能及效率。
-
公开(公告)号:CN104915966B
公开(公告)日:2018-02-09
申请号:CN201510233587.5
申请日:2015-05-08
Applicant: 上海交通大学
Abstract: 本发明公开一种基于卡尔曼滤波的帧率上变换运动估计方法及系统。所述方法包括以下步骤:首先设置卡尔曼滤波模型的参数以及状态初始值,使得模型与实际系统吻合;然后通过先进行单向运动估计、后映射到内插帧的策略得到运动矢量观测值;最后采用一种增益时变的卡尔曼滤波方法对观测矢量进行更新,从而得到更为准确的运动矢量。在此方法基础上,提出一种基于卡尔曼滤波的帧率上变换运动估计硬件架构,通过交替的块扫描顺序以及并行的两路数据通道实现系统的高利用率以及高吞吐率。
-
公开(公告)号:CN104243887B
公开(公告)日:2017-08-01
申请号:CN201410457742.7
申请日:2014-09-10
Applicant: 上海交通大学
IPC: H04N7/01
Abstract: 本发明提供了一种基于不规则采样的电影模式检测方法和装置,其将每帧图像划分为多个图像子块;对相邻的图像子块,采用互异的不规则采样选出采样位置的像素;然后分块统计出这些像素的灰度直方图。在对当前帧进行直方图统计的同时,并行计算其与前一帧图像的直方图差值;当前帧图像扫描结束时,得到其直方图以及该直方图与前一帧直方图的差值,此灰度直方图参与到下一帧的计算当中;最终根据直方图差的大小确定电影模式。本发明占用很小的存储器资源;准确性较高,克服了传统基于直方图的方法对包含局部运动或全局平缓运动的序列无法正确检测的缺点。
-
公开(公告)号:CN106373131A
公开(公告)日:2017-02-01
申请号:CN201610729055.5
申请日:2016-08-25
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于边缘的图像显著性区域检测方法,包括以下步骤:步骤一:将原始图像通过边缘检测得到超度量等高线图UCM;步骤二:针对UCM通过不同的门限去得到两个不同尺度的超像素划分;步骤三:在细颗粒度的超像素划分层面上同时考虑颜色对比度、空间先验和边界先验去得到初始显著性值;步骤四:在细颗粒度的超像素划分层面上,以每个超像素为节点,边缘强度为边建立一个无方向的图,通过计算图上不同节点的测地距离得到背景先验;步骤五:联合考虑初始显著性值、背景先验和不同尺度的一致性去得到最终的显著性值。本发明能够得到统一高亮的显著性物体或者区域,能够有助于图像缩放和图像分割等应用。
-
公开(公告)号:CN106231301A
公开(公告)日:2016-12-14
申请号:CN201610585100.4
申请日:2016-07-22
Applicant: 上海交通大学
IPC: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
CPC classification number: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
Abstract: 本发明提供一种基于编码单元层次和率失真代价的HEVC复杂度控制方法,步骤为:用户设定视频编码目标复杂度系数;统计第一个GOP中的各个编码单元层次的复杂度,计算出各个编码单元层次的复杂度的比值,并通过不同的编码单元层次组合得到不同的门限值;把目标复杂度平均分配到待编码GOP内的每一帧,把复杂度平均分配给编码树单元,根据分配到的复杂度选择连续的两个编码单元层次的层数,然后确定每一个编码单元层数的个数和位置。本发明考虑了基于编码单元层次和率失真代价,整个方法避免引入额外的复杂度,且无需专门的训练视频序列,对于任何视频可以直接编码,能够在GOP级别在一定范围内实现复杂度的有效控制。
-
公开(公告)号:CN106231300A
公开(公告)日:2016-12-14
申请号:CN201610585079.8
申请日:2016-07-22
Applicant: 上海交通大学
IPC: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
CPC classification number: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
Abstract: 本发明提供一种基于编码单元层次的HEVC复杂度控制方法,包括以下步骤:用户设定视频编码目标复杂度系数,正常编码并统计第一个GOP中的各个编码单元层次的复杂度和一个GOP的总的复杂度,计算出各个编码单元层次的复杂度的比值,并通过不同的编码单元层次组合得到不同的门限值;把目标复杂度平均分配到待编码GOP内的每一帧,把复杂度平均分配给剩下的编码树单元,每个编码树单元根据分配到的复杂度选择编码单元层次的组合,编码完成后更新剩余的复杂度。本发明能够在GOP级别在一定范围内实现复杂度的控制,在每一帧编码复杂度的控制上更为准确,波动更小。
-
公开(公告)号:CN106170089A
公开(公告)日:2016-11-30
申请号:CN201610729053.6
申请日:2016-08-25
Applicant: 上海交通大学
IPC: H04N19/147 , H04N19/103 , H04N19/124
Abstract: 本发明公开了一种基于H.265的多路编码系统及方法,该系统包括主编码器模块、从编码器模块,主编码器模块,与多个从编码器模块连接,将编码信息共享给从编码器模块,从编码器模块,利用共享信息,对编码过程加速,主编码器模块和从编码器模块均对同一个输入视频数据进行压缩编码,采用不同的码率控制参数,同时输出不同质量的码流。本发明复用了一路主编码器的最优编码模式,加速了多路从编码器的编码过程,实现了在不降低编码质量的前提下,快速进行多路视频编码;本发明对1920×1080分辨率的高清视频进行多路编码,在28核的Intel(R)Xeon(R)CPU E5‑2697v3@2.60GHz工作站上运行,比相同编码参数配置情况下的多次编码节省了44.68%的编码时间,同时性能没有下降。
-
-
-
-
-
-
-
-
-