-
公开(公告)号:CN108470324B
公开(公告)日:2022-02-25
申请号:CN201810236089.X
申请日:2018-03-21
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
-
公开(公告)号:CN108596915A
公开(公告)日:2018-09-28
申请号:CN201810331487.X
申请日:2018-04-13
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 本发明公开了一种基于无标注数据的医疗图像分割方法,包括以下步骤:A1:采用有标注数据对分割网络进行训练;A2:将包含无标注数据和有标注数据的训练图像输入到所述分割网络进行分割,并将得到的分割结果输入到评价网络;A3:采用所述评价网络对分割结果进行评价;A4:对所述分割网络和所述评价网络进行对抗式训练;A5:当所述分割网络和所述评价网络达到动态平衡时,根据所述分割网络得到无标注数据的最终分割结果。本发明实现了无标注医疗图像的端到端分割,而不需要提前标注好大量医疗图像再用这些标注好的图像来训练分割网络,方法简单高效。
-
公开(公告)号:CN105551050B
公开(公告)日:2018-07-17
申请号:CN201511019609.4
申请日:2015-12-29
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
IPC: G06T7/50
Abstract: 本发明涉及一种新的基于光场的图像深度估计方法。这种方法主要由三个重要部分组成:光场原始数据视点提取方法、基于块匹配的深度估计算法和基于显著特征约束的深度优化算法。所提出的光场原始数据视点提取方法,对未经去马赛克的光场数据进行视点分离;所采用的基于块匹配的深度估计算法仅对与中心视点处于同一行或同一列的视点对上并且记录相同光线颜色的对应块进行相似性度量;为优化深度估计结果,本发明提出基于显著特征约束的深度优化算法,提取显著特征点并进行匹配,将显著特征点的视差作为强约束条件。本发明的方法避免了插值过程引起的视点混淆,提升了深度估计准确性。
-
公开(公告)号:CN107679477A
公开(公告)日:2018-02-09
申请号:CN201710889248.1
申请日:2017-09-27
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 基于空洞卷积神经网络的人脸深度和表面法向量预测方法,包括训练空洞卷积神经网络的步骤:S1、搭建一空洞卷积神经网络,包括依次连接的多个卷积层、多个空洞卷积层和多个反卷积层,其中,每个卷积层均连接有一规范化操作和一激励操作;S2、初始化空洞卷积神经网络的权重值;S3、将训练图片输入空洞卷积神经网络中,以最小化代价函数为目标对所述空洞卷积神经网络进行迭代训练;每迭代一次则更新一次权重值;S4、将测试图片输入训练得到的空洞卷积神经网络中,输出对应的人脸深度图和表面法向量图;S5、根据输出的人脸深度图和人脸表面法向量图判断训练的空洞卷积神经网络预测精度是否符合要求:若符合结束训练;若不符合返回步骤S3继续训练。
-
公开(公告)号:CN106162164B
公开(公告)日:2018-01-30
申请号:CN201610643932.7
申请日:2016-08-08
Applicant: 清华大学深圳研究生院 , 深圳市未来媒体技术研究院
Abstract: 本发明公开了一种融合神经种群编码模型的3D主观质量预测方法,包括:S1、建立基于支持向量回归的3D主观质量预测模型;S2、基于失真深度图得到视差图;S3、计算视差图在神经种群编码模型下的13维响应;S4、将上述13维响应联合深度图的纹理特征和失真特征参数作为模型的输入,得到3D图像体验质量值。本发明能够以数学模型的形式,融合深度图的纹理特征和计算神经学的神经种群编码模型响应预测其合成图的3D图像体验质量值,对探究多视点视频的体验质量及优化多视点视频编码具有重要的意义。
-
公开(公告)号:CN107103613A
公开(公告)日:2017-08-29
申请号:CN201710192287.6
申请日:2017-03-28
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 本发明公开一种三维手势姿态估计方法,包括:S1、获取多张手势深度图并进行手势前景与背景的分割,以得到多张手势前景图并随机分为训练集和测试集;S2、按照手势模型图构建各手势前景图的实际标签图,实际标签图包含手势前景图中代表人手各参考辨识点的多个坐标点,每个坐标点的值包含对应的参考辨识点的坐标值和深度值;S3、选取训练集中的多张手势前景图对全卷积神经网络进行训练,并对应地输出多个预测标签图;S4、比较实际标签图与预测标签图之间的偏差,同时更新网络参数;S5、以不断降低偏差进行迭代,直至网络参数收敛;S6、输入待估计的手势深度图,输出对应的标签图,即为估计结果。
-
公开(公告)号:CN107024828A
公开(公告)日:2017-08-08
申请号:CN201710196808.5
申请日:2017-03-29
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 本发明公开了一种可共光心的摄像机装置、全景无缝拼接组件及方法,其中摄像机装置包括摄像机、第一平面镜和第二平面镜,所述第一平面镜和第二平面镜的镜面相互平行,均垂直于所述摄像机的主光轴;所述第一平面镜位于所述摄像机的前方的预设距离处,镜面朝向所述摄像机;所述第二平面镜位于所述摄像机的镜头位置处,镜面朝向所述第一平面镜,在所述第二平面镜上设有孔洞,用于供所述摄像机拍摄图像。通过本发明的摄像机装置可以使得多个摄像机的光心重叠在一起,从而拍摄无视差的视频,进而进行无缝的全景拼接。
-
公开(公告)号:CN106875338A
公开(公告)日:2017-06-20
申请号:CN201710084744.X
申请日:2017-02-16
Applicant: 清华大学深圳研究生院 , 深圳市未来媒体技术研究院
IPC: G06T3/40
Abstract: 一种基于群组稀疏处理的图像超分辨率处理方法,包括以下步骤:A1:利用FPM平台成像装置获取由LED阵列中不同LED灯逐个点亮所获得的不同角度光照下对应的低分辨率图像gi(x,y);A2:由所述低分辨率图像通过迭代以及在实域与频域的约束条件得到对应样本的高分辨率图像Sg;A3:获取所述高分辨率图像的幅值矩阵,将其进行分块,根据块的相似性建立群组字典,在根据字典的图像重构过程中加入稀疏约束,得到经过稀疏处理的高分辨率图像幅值矩阵Zgam;A4:将Zgam乘以之前的相位矩阵Zgph,得到中间变量Zg,在正常FPM迭代过程中以拉格朗日乘积的形式将Sg与Zg的差值引入,得到最终恢复的高分辨率图像。该图像超分辨率处理方法能够恢复更多图像细节信息,且防止图像恢复过程对所采集的带误差的低分辨率图像的过拟合现象。
-
公开(公告)号:CN106331680A
公开(公告)日:2017-01-11
申请号:CN201610657639.6
申请日:2016-08-10
Applicant: 清华大学深圳研究生院 , 深圳市未来媒体技术研究院
IPC: H04N13/02
CPC classification number: H04N13/261
Abstract: 本发明公开了一种手机端2D转3D自适应云卸载的方法和系统,该方法包括如下步骤:A1.输入一帧2D单目图像,将图像等分成N个图像块;A2.将图像块进行分类,分类为远景视图、线性视图和普通视图;A3.根据已划分视图的类别,分别计算每个图像块深度估计的算法复杂度;A4.将每个图像块的算法复杂度,代入云端卸载动态资源分配模型,最优化得到分配结果;A5.按照A4得到的分配结果,分别在手机端和云端进行深度估计,生成深度图。该方法和系统通过建立云端卸载动态资源分配模型,形成基于云计算的手机端2D转3D的自适应卸载方法和系统,将手机端复杂的计算卸载到云端,从而释放手机端的存储资源,提高手机的处理速度,降低手机的功耗;同时获得深度估计合理,运行速度高效的高质量深度图。
-
公开(公告)号:CN106303228A
公开(公告)日:2017-01-04
申请号:CN201610632949.2
申请日:2016-08-04
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 本发明公开了一种聚焦型光场相机的渲染方法和系统,该方法包括:S1.输入聚焦型光场相机拍摄的图片,记录每个微透镜和子孔径图的位置信息和中心位置;S2.根据需要重聚焦的平面图像,计算其景深,根据景深确定半径R的大小;S3.在每一个子孔径图的中心位置,取一个半径为R的正六边形区域块;S4.将正六边形区域块,按子孔径图的顺序平铺合并得合并图;S4.对合并图进行处理,得到最终渲染图。该方法利用微透镜阵列的六边形排列特性,通过对微透镜子孔径图取正六边形的区域块,在渲染过程中,无需经过坐标系的变换,能有效减少聚焦型光场相机的渲染方法的计算量。
-
-
-
-
-
-
-
-
-