-
公开(公告)号:CN108053368B
公开(公告)日:2020-11-03
申请号:CN201711362812.0
申请日:2017-12-18
Applicant: 清华大学
Abstract: 本发明公开了一种跨尺度分辨率的光场图像超分辨率及深度估计方法及装置,其中,方法包括:通过单张图像超分辨率SISR方法进行上采样;将位于中间视角的高分辨率图像下采样后,利用SISR方法进行上采样,并获取误差图;获取视差图并利用光场固有属性对视差图进行全局优化,同时进行补洞操作,使得视差图估计无法估计到的区域进行重新估计;利用全局视差图对误差图进行传递,使得图像恢复高分辨率信息,以实现光场的超分辨率重建;根据超分辨率后的光场图像进行场景的深度估计,获取深度估计结果。该方法可以利用全局视差图对误差图进行传递,使得图像恢复高分辨率信息,以通过高分辨光场获取场景深度信息,并且提高鲁棒性,计算速度快。
-
公开(公告)号:CN108108768B
公开(公告)日:2020-09-25
申请号:CN201711481653.6
申请日:2017-12-29
Applicant: 清华大学
Abstract: 本发明公开了一种基于卷积神经网络的光伏玻璃缺陷分类方法及装置,其中,方法包括:对多种的缺陷样本进行多角度变光照的图像采集,以得到多个图像;预处理各图像并融合多通道信息,生成多通道融合的缺陷样本图像;采用满足预设条件的卷积神经网络模型,根据缺陷类别设计特征提取网络,以构建特征提取卷积神经网络;获取全连接神经网络的层数及各层神经元个数,构建特征分类网络;在最小化交叉熵损失函数的条件下,完成卷积神经网络的训练;根据输入的样本图像,通过训练后的卷积神经网络,输出缺陷类别的预测结果。该方法可以在保证模型泛化能力和预测精度的同时,有效解决训练集不充足的情况,并且对少量的玻璃缺陷样本能达到较高的分类精度。
-
公开(公告)号:CN111462301A
公开(公告)日:2020-07-28
申请号:CN202010147283.8
申请日:2020-03-05
Applicant: 清华大学
Abstract: 本发明公开了一种用于多视图植物三维重建的生成模型的构建方法,该方法包括:利用贝叶斯概率框架构建植物生长模型,通过对支取生长模型赋予带参先验概率,构建植物骨架生长的概率表示;通过在根节点上指定初始生长因子和分叉代数限制,植物生长模型通过随机采样生成实例化的骨架;获取同种植物的图像集,植物生长模型利用矢量场方法对图像集中的每个单图像计算一个2D骨架,通过对2D骨架聚类分析,提取出图像集的形态基元,利用形态基元的模型与训练集中的骨架拟合,使用高斯-牛顿梯度下降方法求取植物生长模型参数的最优解。该方法能够反映植物生长姿态特性的贝叶斯概率模型,可作为植物表示的一般框架,能用于多视图植物重建。
-
公开(公告)号:CN111445475A
公开(公告)日:2020-07-24
申请号:CN202010120944.8
申请日:2020-02-26
Applicant: 清华大学
Abstract: 本发明公开了一种基于反向动力学的人体模型姿态预测方法,该方法包括利用人体运动,通过图像提取人体的姿态信息,并使用多帧求解人体运动信息,从而进行人体三维模拟和模型姿态预测,人体模型姿态模拟方法基于人体模板匹配的方法,根据已有的基于单RGB图像估计人体模型的方法进行人体姿态和体型求解;模型姿态预测方法基于反向动力学,先求解出已有帧中广义力参数,再通过神经网络预测外插方法获得后续帧广义力,以及动力学方程求解后续运动。通过计算机视觉和反向动力学方法,可以获得图像序列中的人体姿态以及实现姿态预测。
-
公开(公告)号:CN110335343A
公开(公告)日:2019-10-15
申请号:CN201910512083.5
申请日:2019-06-13
Applicant: 清华大学
Abstract: 本发明公开了一种基于RGBD单视角图像人体三维重建方法及装置,其中,方法包括:通过深度相机采集人体的RGBD图片,图片包括单视角彩色图片和深度图片的;根据RGBD图片分别得到三维人体模型参数、人体分割信息和二维关节点信息;根据人体分割信息、二维关节点信息和深度图片得到人体三维关节点信息,以根据人体三维关节点信息对三维人体模型的关节点和身体形状进行约束,并优化三维人体模型参数和三维人体模型;根据优化后的三维人体模型渲染深度图片,并利用单视角彩色图片对优化后的三维人体模型的正面进一步优化,以得到人体的三维重建结果。该方法可以利用深度相机采集到的单帧单视角RGBD图片信息进行人体的三维重建。
-
公开(公告)号:CN110307788A
公开(公告)日:2019-10-08
申请号:CN201910631825.6
申请日:2019-07-12
Applicant: 清华大学
Abstract: 本发明公开了一种多深度相机人体参数测量方法及装置,其中,该方法包括以下步骤:采集当前对象深度图像;将深度图像融合为规则点云;拟合参数化人体模板,求解参数化人体模板的形态参数和姿态参数,使得基于上述参数变形的SMPL人体模板与所获得点云尽可能拟合;通过标准参数化人体模板定义的人体参数获取方式获取当前对象的人体参数。该方法对设备要求低,精确鲁棒,使用简单,适合普通商户使用,拥有广阔的应用前景。
-
公开(公告)号:CN110211061A
公开(公告)日:2019-09-06
申请号:CN201910417886.2
申请日:2019-05-20
Applicant: 清华大学
Abstract: 本发明公开了一种基于神经网络的单深度相机深度图实时增强方法及装置,其中,该方法包括:通过深度相机采集样本的深度图像和RGB图像,根据标定的深度相机内外参矩阵将深度图像与RGB图像对齐,以及将RGB图像转换到灰度空间并进行放射变换,得到与深度图像的特征对齐的灰度图;构建前向神经网络和损失函数,将深度图像和灰度图输入前向神经网络进行训练,并根据损失函数反向传播更新前向神经网络的权重;将灰度图输入到训练更新权重后的前向神经网络以输出增强深度图像。该方法利用深度相机对样本进行拍摄采集深度图像,无需高精度的扫描设备采集真实深度图作为监督信息,省去了人工标定的过程,为用户提供良好的交互式三维重建体验。
-
公开(公告)号:CN108898658A
公开(公告)日:2018-11-27
申请号:CN201810460082.6
申请日:2018-05-15
Applicant: 清华大学
Abstract: 本发明公开了一种基于光影优化的三维几何与本征成份重建方法及装置,其中,方法包括:通过RGBD相机得到三维彩色点云时间序列拍摄;获取三维深度点云和重建模型顶点之间的匹配点对,并获得点对集合;根据匹配点对及当前视角彩色图像建立基于本征分解的联合能量函数,并求解重建模型上每一个顶点的非刚性运动位置变换参数;对能量函数进行求解,获得表面模型顶点的形变变换矩阵以及图像上每个项目的本征成份;根据求解结果将前一帧三维模型的几何进行形变,补全和更新当前帧模型的几何和本征成份,实现三维几何与本征成份重建。该方法能够高稀疏和单个视点条件下动态对象跟踪形变的鲁棒性,且求解准确,对设备要求低,拥有广阔的应用前景。
-
公开(公告)号:CN108230223A
公开(公告)日:2018-06-29
申请号:CN201711462902.7
申请日:2017-12-28
Applicant: 清华大学
Abstract: 本发明公开了一种基于卷积神经网络的光场角度超分辨率方法及装置,其中,方法包括:根据低角度分辨率光场提取多个二维极线平面图;通过一维高斯核函数对多个二维极线平面图的每个极线平面图提取出空间低频信息;并通过双三次插值方法进行角度维度的上采样,使其达到期望的角度分辨率;通过卷积神经网络对上采样后的极线平面图重建出角度信息;通过非盲去模糊操作恢复极线平面图的空间高频信息,获取角度超分辨率后的高空间角度分辨率的极线平面图;根据角度超分辨率后的高空间角度分辨率的极线平面图输出高角度分辨率光场。该方法有效利用二维极线平面图的纹理信息,可以提高光场超分辨率的整体精确度,具有很强的鲁棒性。
-
公开(公告)号:CN108021914A
公开(公告)日:2018-05-11
申请号:CN201711449254.1
申请日:2017-12-27
Applicant: 清华大学
Abstract: 本发明公开了一种基于卷积神经网络的印刷品字符区域提取方法,包括:通过卷积神经网络从整个图像角度对字符区域进行探测,获取字符区域全局感知的字符候选图像;通过笔画探测器探测图像局部细节;将字符候选图像和图像局部细节进行融合,以提取出印刷品字符区域。该方法可以避免传统方法对于人工确定的阈值的依赖,实现用轮廓勾画出印刷品图像中的字符区域,并且画出的轮廓具有很好的视觉舒适度,有效提高泛化性能。
-
-
-
-
-
-
-
-
-