-
公开(公告)号:CN113688694A
公开(公告)日:2021-11-23
申请号:CN202110884878.6
申请日:2021-08-03
Applicant: 上海交通大学
Abstract: 本发明提供一种基于非配对学习的提升视频清晰度的方法及装置,包括:对于给定的低清晰度视频,选择内容相似的非配对高清晰度视频作为参考并进行降采样使其相似度相近,取高低清晰度视频关键帧中的亮度分量进行量化并随机裁切图像块,形成低清晰度‑非配对高清晰度图像数据集;建立基于卷积神经网络的低清晰度图像生成器、低清晰度图像判别器和高清晰度图像生成器;通过综合目标函数训练生成对抗网络,使得两个生成器都能实现更好的低高清晰度图像域之间的相互映射。本发明使用视频内容主体相似的非配对真实低高清视频进行训练,跳脱出了以往配对学习方法中特定质量退化方式的限制,利用非配对学习的方法实现了低清晰度视频图像的联合增强。
-
公开(公告)号:CN113162895A
公开(公告)日:2021-07-23
申请号:CN202011527069.1
申请日:2020-12-22
Applicant: 咪咕文化科技有限公司 , 上海交通大学 , 中国移动通信集团有限公司
IPC: H04L29/06 , H04N19/124 , H04N19/154 , H04N19/167 , H04N19/17
Abstract: 本发明提供一种动态编码方法、流媒体质量确定方法及电子设备,属于信息处理技术领域,其中应用于第一电子设备的动态编码方法包括:根据第一流媒体数据的流媒体质量信息,选择编码参数;根据所述编码参数对第二流媒体数据进行编码;其中,所述第一流媒体数据是已传输至客户端进行播放的流媒体数据,所述第二流媒体数据是当前待传输至所述客户端的流媒体数据。本发明可以达到当前用户网络条件下,用户流媒体体验质量最大化,提高用户的业务体验。
-
公开(公告)号:CN110728633A
公开(公告)日:2020-01-24
申请号:CN201910840411.4
申请日:2019-09-06
Applicant: 上海交通大学
Abstract: 本发明提供一种多曝光度高动态范围反色调映射模型构建方法及装置,包括:从原始高动态范围视频中截取的高动态范围图像,转化为标准动态范围图像,调整曝光时间产生多曝光度的标准动态范围图像,不同曝光度的标准动态范围图像与同一幅正常曝光度的高动态范围图像组成有监督的数据集,作为训练数据集;建立基于卷积神经网络和跳跃式连接的生成对抗网络;对生成对抗网络建立由图像内容特征、本征特征和感知特征综合的目标损失函数,采用训练数据集不断训练优化,得到最终模型。本发明能调节过曝光或欠曝光图像的亮度,提升生成的高动态范围图像的效果,且考虑到高动态范围图像的亮度特性与色度特性,更好地实现了对高动态范围的反色调映射。
-
公开(公告)号:CN104135597B
公开(公告)日:2017-12-15
申请号:CN201410318324.X
申请日:2014-07-04
Applicant: 上海交通大学
Abstract: 本发明公开一种视频抖动自动检测方法,包括:第一步,在视频画面中选取特征点,第二步,在相邻帧中跟踪匹配特征点,第三步,对特征点对进行异常点去除得到帧间运动矢量,第四步,提取视频抖动频率、视频抖动幅度特征,第五步,提取帧间光流矢量直方图特征,第六步,分类器判断视频抖动程度。本发明在判断视频是否存在抖动时不需要任何先验知识,而且有较高的准确率。
-
公开(公告)号:CN103888782B
公开(公告)日:2017-02-08
申请号:CN201410077419.7
申请日:2014-03-04
Applicant: 上海交通大学
Abstract: 本发明公开了一种HEVC解码器并行任务划分方法,该方法将对网络抽象层单元的处理、对参数集和头信息的解码,以及对解码图像缓冲区的管理工作交由一个控制单元执行,将解码编码树单元需要的熵解码、反量化、反变换、帧内预测、帧间预测、去块滤波以及像素自适应补偿过程交由若干个工作单元并行执行,上述控制单元和工作单元之间满足流水线式的工作方式。本发明可以更好地保证负载平衡性并去除同步过程对于锁结构的依赖,从而提高了计算资源利用率并节约了同步开销。
-
公开(公告)号:CN106303704A
公开(公告)日:2017-01-04
申请号:CN201610697879.9
申请日:2016-08-19
Applicant: 上海交通大学
IPC: H04N21/442 , H04N21/845 , H04L29/06
Abstract: 本发明提供了一种基于代理服务器的DASH流媒体直播系统及方法,所述系统包括:DASH服务器;代理服务器,向DASH服务器请求视频分片并存储,增加码率重要性表,用来合并客户端的视频请求;客户端,向代理服务器发送视频分片请求,客户端使用码率切换方法来选择视频分片以更高效利用当前带宽以及缓存。本发明设计了新的基于代理服务器的网络拓扑模式,在客户端给出了适应当前带宽的DASH直播系统的码流切换方法,并在代理服务器端提出了动态缓存方法。本发明解决了DASH直播系统中码流切换过于频繁的问题,减小了网络的负载压力,从而提高了DASH协议在直播环境应用中的QoE性能和网络性能方面的表现。
-
公开(公告)号:CN103763569B
公开(公告)日:2016-11-09
申请号:CN201410005285.8
申请日:2014-01-06
Applicant: 上海交通大学
IPC: H04N19/96 , H04N19/159 , H04N19/103
Abstract: 本发明公开一种基于先入先出队列的HEVC细粒度并行预测方法,其特征在于:允许一个编码树单元内部多个不同CU同时进行预测过程,并利用多个先入先出队列管理CU间的同步和通信。与现有技术相比,本发明充分利用了CTU内部的并行性,可以达到CTU内部理论上的最大并行度,并且不会带来任何压缩性能损失。
-
公开(公告)号:CN104952073A
公开(公告)日:2015-09-30
申请号:CN201510332345.1
申请日:2015-06-15
Applicant: 上海交通大学
IPC: G06T7/00
CPC classification number: G06T7/13 , G06T2207/10016
Abstract: 本发明公开一种基于深度学习的镜头边缘检测方法,首先将视频分段,计算各段的帧内亮度距离的局部阈值,选出镜头边缘候选段,剔除不含镜头边缘的视频段;将镜头边缘候选段两次进行二分处理,根据新分出的两小段的段内亮度距离的关系来选出镜头边缘候选段,剔除不含镜头边缘的视频段;对长度为6帧的镜头边缘候选段,选取该段的关键帧,输入卷积神经网络得到关键帧的标签,进一步确定该段内是否有突变镜头边缘以及其位置;而对于没有突变镜头边缘的镜头边缘候选段,选取该段的关键帧,输入卷积神经网络得到关键帧的标签,根据标签来确定该候选段是否是渐变镜头边缘;将相邻的渐变镜头边缘融合成为一个渐变镜头边缘。
-
公开(公告)号:CN103763569A
公开(公告)日:2014-04-30
申请号:CN201410005285.8
申请日:2014-01-06
Applicant: 上海交通大学
IPC: H04N19/96 , H04N19/159 , H04N19/103
Abstract: 本发明公开一种基于先入先出队列的HEVC细粒度并行预测方法,其特征在于:允许一个编码树单元内部多个不同CU同时进行预测过程,并利用多个先入先出队列管理CU间的同步和通信。与现有技术相比,本发明充分利用了CTU内部的并行性,可以达到CTU内部理论上的最大并行度,并且不会带来任何压缩性能损失。
-
-
-
-
-
-
-
-
-