-
公开(公告)号:CN114972036A
公开(公告)日:2022-08-30
申请号:CN202210657948.9
申请日:2022-06-10
Applicant: 上海交通大学
Abstract: 本发明提供一种基于融合退化先验的核反卷积盲图像超分辨率重建网络;低分辨率图像输入所述上采样网络,重建出满足原始模糊核约束的高分辨率尺度的过渡图像;将所述过渡图像和所述原始模糊核输入所述反卷积网络,实现高分辨率图像的重建。本发明通过引入退化建模的方式,将盲图像超分辨率重建解耦,并将完整原始模糊核显式引入重建过程中,避免了由于引入预生成的模糊核降维手段而带来的模糊核信息丢失,以及面对未知退化核而带来的泛化性问题,端到端的实现了盲图像超分辨率重建。
-
公开(公告)号:CN113239924B
公开(公告)日:2022-04-26
申请号:CN202110556712.1
申请日:2021-05-21
Applicant: 上海交通大学
IPC: G06V10/22 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/08
Abstract: 本发明公开了一种基于迁移学习的弱监督目标检测方法及系统,该方法包括:对输入的强监督及弱监督的图像,使用深度卷积神经网络提取图像的特征,利用区域建议网络提取图像中的候选框,得到不同候选区域的视觉特征;对强监督及弱监督数据集中的类别文本进行特征提取,建立语义图,并利用图卷积网络进行优化,得到所有类别文本的语义特征;使用双监督的平均教师网络结构,包括:强监督分类及边界回归学生网络、弱监督多示例学习学生网络以及分类及边界回归教师网络,利用视觉特征以及优化后的语义特征,聚合强监督及弱监督数据集中的边界框信息和分类信息,从而对候选框进行边界框的回归和分类。通过本发明,提升了弱监督目标检测的效果。
-
公开(公告)号:CN108235113B
公开(公告)日:2022-01-04
申请号:CN201611155809.7
申请日:2016-12-14
Applicant: 上海交通大学
IPC: H04N21/44 , H04N21/235 , H04N21/4402 , H04N21/81 , H04N13/122
Abstract: 本发明提供一种全景视频渲染和呈现属性指示方法及系统,所述方法在与全景视频渲染和呈现相关联的描述信息中针对所述全景视频插入第一指示信息,以及第二指示信息和/或第三指示信息;所述第一指示信息对所述全景视频的媒体内容属性进行指示,包括:全景视频的映射格式的标识符;全景视频是否覆盖360度视角的标识符;所述第二指示信息,对所述全景视频的空间信息进行指示;所述第三指示信息,对所述全景视频的质量信息进行指示。本发明能够实现基于视角的媒体内容的渲染和呈现,匹配视角的全景视频能在网络带宽受限的情况下尽可能满足用户对全景视频的高质量消费需求。
-
公开(公告)号:CN107784686B
公开(公告)日:2021-06-11
申请号:CN201610726946.5
申请日:2016-08-25
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于多分辨率的多视角媒体呈现方法,包括以下步骤:步骤一:用户登录服务,服务器向用户下发空间分块信令信息和多分辨率多视角信令信息;步骤二:用户根据感兴趣的区域,结合空间分块信令信息指示的分块视频位置关系,向服务器请求分块视频和低分辨率视频;步骤三:服务器向客户端发送其请求的分块视频和低分辨率视频;步骤四:将不同视角和不同分辨率的媒体内容结合呈现给用户;步骤五:重复步骤二、步骤三、步骤四。本发明既解决了切换黑屏问题,又保证了多分辨率和多视角结合的灵活性。
-
公开(公告)号:CN110363201B
公开(公告)日:2021-06-01
申请号:CN201910619773.0
申请日:2019-07-10
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于协同学习的弱监督语义分割方法及系统,所述方法包括:特征图提取步骤:对输入的原始图像,使用深度神经网络提取图像的高层特征图;定位图提取步骤:使用定位子网络,在特征图上基于图像标签提取物体的定位图;分割图提取步骤:使用分割子网络和条件随机场,在特征图上提取物体分割图;伪标签生成步骤:在物体定位图和分割图上,利用阈值选取得到物体定位伪标签和物体分割伪标签;伪标签结合步骤:物体定位伪标签和物体分割伪标签使用一种自适应的混合策略进行混合。所述系统包括与所述各步骤相对应的模块,本发明能够仅通过提供图像级别的标签,训练对图像的像素级别预测的模型,从而完成对图像的语义分割。
-
公开(公告)号:CN110033054B
公开(公告)日:2021-05-25
申请号:CN201910195271.X
申请日:2019-03-14
Applicant: 上海交通大学
IPC: G06K9/68 , G06K9/62 , G06N3/04 , G06N3/08 , G06F40/109
Abstract: 本发明提供了一种基于协同笔画优化的个性化手写体迁移方法和系统,该方法,包括:根据目标汉字的平均区域占比和平均长宽比,对待输入的汉字进行尺寸和比例的形变处理,以使得所述待输入的汉字与所述目标汉字的骨架对齐;将形变处理之后的汉字输入目标神经网络,通过所述目标神经网络输出对应的目标汉字;其中,所述目标神经网络是指经过训练的对抗生成网络,用于将输入的汉字转换为目标字体汉字。从而实现依靠少量数据集将任一印刷体汉字迁移成另一印刷体或手写体汉字,甚至能够做到个性化手写字体定制,能够快速、准确、逼真地生成目标字体。
-
公开(公告)号:CN107968755B
公开(公告)日:2021-04-02
申请号:CN201610916187.9
申请日:2016-10-20
Applicant: 上海交通大学
IPC: H04L12/933 , H04L12/947 , H04L29/06 , H04L29/08
Abstract: 本发明提供一种基于MMT协议的媒体内容存储转发的路由选择方法及系统,包括:客户端发送对于媒体内容的请求,该请求被传递到默认缓存设备;解析客户端的请求,默认缓存设备分别确认出客户端所请求内容中缓存命中和缓存缺失的媒体内容部分,其中缓存命中的部分被发送给客户端,缓存缺失的媒体内容部分的缓存单元列表通过信令发送至默认缓存设备的邻近缓存设备中,每个邻近缓存设备检查自身缓存状态等反映其服务能力的参数并通过信令发送给路由选择服务器,确定最佳缓存设备或者源内容服务器,由其向客户端发送在默认缓存设备中缓存缺失的媒体内容部分。本发明能实现在多缓存设备环境下通过选择最佳缓存设备响应客户端请求,从而提升用户体验。
-
公开(公告)号:CN109583741B
公开(公告)日:2021-03-09
申请号:CN201811408039.1
申请日:2018-11-23
Applicant: 上海交通大学
Inventor: 王延峰
Abstract: 本发明提供了一种行驶轨迹风险评估方法和系统,将全路网中每条路的特征采集,将路段特征集中的数据进行标准化处理,得到标准化数据,对标准化数据分析后,初步建立出风险评估模型后,以预设调整验证方式对作为观测样本的某条路段确定邻居路段范围,依此确定出路网中每一条路段的所述邻居路段范围,从而完成风险评估模型的验证调整,再继而处理得到整条行驶轨迹风险值,此过程考虑到了路段化分析,避免了因全局化、区域化的分析带来的结果偏差大、模型不稳定的影响,本发明所提供的行驶轨迹风险评估方法模型稳定性高、风险值结果偏差小、精确度高。
-
公开(公告)号:CN110944222B
公开(公告)日:2021-02-12
申请号:CN201811108139.2
申请日:2018-09-21
Applicant: 上海交通大学
IPC: H04N21/41 , H04N21/6587 , H04N13/344
Abstract: 本发明提供了一种沉浸媒体内容随用户移动变化的方法及系统,包括:读取并解析视频流;确定视点个数、初始视点、视点间的相对关系以及每个视点的最大覆盖半径值;根据用户的位置反馈用户对于初始视点的相对位移;根据视点间的相对关系、每个视点的最大覆盖半径值以及相对位移选择当前视点;根据相对位移确定当前的深度值,根据视点内视野和深度的关系确定当前视点的观看视野内容;呈现视频流中与观看视野内容相应的内容。本发明支持用户观看区域与当前视点相对初始视点成一定关系变化,同时支持不同视点切换。
-
公开(公告)号:CN109726671B
公开(公告)日:2020-08-04
申请号:CN201811612590.8
申请日:2018-12-27
Applicant: 上海交通大学
Abstract: 本发明提供一种从全局到类别特征表达学习的动作识别方法和系统,对输入的动作视频,使用深度神经网络学习动作数据的全局特征表达并提取特征;通过提取到的全局特征表达,使用特征通道稀疏度来获取类别间的相似度结构关系;对输入的每一类视频动作,使用全卷积深度神经网络学习其相应的类别掩膜;使用得到的类别间相似度结构关系来约束类别掩膜的相似程度;对输入的动作视频,使用深度神经网络学习动作数据的类别特定特征表达并提取相应特征;对提取的全局和类别特定特征进行融合,得到最终具有区分性表达的特征并完成动作的识别。能够对输入的动作视频提取从全局到类别特定的特征表达,进行复杂动作的识别。
-
-
-
-
-
-
-
-
-