-
公开(公告)号:CN108156383A
公开(公告)日:2018-06-12
申请号:CN201711481644.7
申请日:2017-12-29
Applicant: 清华大学
Abstract: 本发明公开了一种基于相机阵列的高动态十亿像素视频采集方法及装置,多尺度相机阵列具有参考相机和至少一个长焦相机,其中,方法包括以下步骤:通过镜头焦距差距对所示至少一个长焦相机的长焦相机图像进行降采样;通过匹配算法获取至少一个长焦相机在参考相机中的位置;将对参考相机中的位置的图像块进行上采样,得到参考块;将长焦相机图像与参考块对齐,以将长焦相机图像嵌入参考相机图像中,并进行图像增强与颜色校正,得到视频采集结果。该方法可以实现十亿像素的视频合成,大大提高了相机阵列的灵活性,使得相机可以自由分配到有需要的区域,增加了CMOS传感器的利用率,且具有非常高的并行度。
-
公开(公告)号:CN108122275A
公开(公告)日:2018-06-05
申请号:CN201711408848.8
申请日:2017-12-22
Applicant: 清华大学
Abstract: 本发明公开了一种基于骨架跟踪的动态实时三维人体重建方法及系统,其中,方法包括:对人体进行深度图拍摄以得到单张深度图像;将单张深度图像变换为三维点云,并获取三维点云和重建模型顶点之间的匹配点对;根据匹配点对建立能量函数,共同求解重建模型上每一个顶点的非刚性运动位置变换参数和人体骨架运动参数;对能量函数进行求解,以根据求解结果将重建模型与三维点云进行对齐,并使用深度图更新和补全对齐后的模型,以实现三维人体重建。该方法可以利用深度相机对人体进行拍摄,从而获得深度图像作为系统输入信息,并基于该深度图像完成对动态人体进行实时三维重建的功能,求解准确鲁棒,简单易实现。
-
公开(公告)号:CN108038893A
公开(公告)日:2018-05-15
申请号:CN201711278764.7
申请日:2017-12-06
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
CPC classification number: G06T11/60 , G06T5/50 , G06T2207/10016 , G06T2207/20221 , H04N7/18
Abstract: 本发明公开了一种基于混合相机阵列的十亿像素视频的生成方法,包括以下步骤:S1:采用混合相机阵列进行图像采集,其中所述混合相机阵列包括至少一个全局相机和多个局部相机,通过至少一个所述全局相机采集得到至少一个全局图像,通过多个所述局部相机分别采集得到多个局部图像;S2:采用网络分类方法查找各个所述局部图像在所述全局图像中的对应图像块;S3:根据步骤S2查找到的各个所述局部图像在所述全局图像中的对应图像块,将各个所述局部图像与所述全局图像进行多尺度融合,生成融合图像,得到十亿像素视频。本发明可以快速高质量地生成十亿像素视频。
-
公开(公告)号:CN107734271A
公开(公告)日:2018-02-23
申请号:CN201710958201.6
申请日:2017-10-16
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 一种高动态范围十亿像素视频生成方法,包括:用多个局部视角相机进行正常采集视频,用中心全局相机进行变曝光采集,使用不同长度的曝光时间对全局进行多次曝光采样,获得不同强度范围入射光的细节;对中心全局相机得到的变曝光采集到的视频图像进行曝光融合,得到全局高动态范围低时域噪声的视频图像;对未进行变曝光采集的局部视频图像预处理,按照设定的比例缩小,利用零均值归一化互相关匹配找到缩小后图像在变曝光融合后的全局图中的位置,从全局图中裁剪出最佳匹配块,放大到与局部视频图像同样大小,作为参考块;对局部视频图像进行特征点提取匹配及变换,利用图割技术将局部视频图像进行拼接。该方法可以得到高动态范围的十亿像素视频。
-
公开(公告)号:CN107679477A
公开(公告)日:2018-02-09
申请号:CN201710889248.1
申请日:2017-09-27
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 基于空洞卷积神经网络的人脸深度和表面法向量预测方法,包括训练空洞卷积神经网络的步骤:S1、搭建一空洞卷积神经网络,包括依次连接的多个卷积层、多个空洞卷积层和多个反卷积层,其中,每个卷积层均连接有一规范化操作和一激励操作;S2、初始化空洞卷积神经网络的权重值;S3、将训练图片输入空洞卷积神经网络中,以最小化代价函数为目标对所述空洞卷积神经网络进行迭代训练;每迭代一次则更新一次权重值;S4、将测试图片输入训练得到的空洞卷积神经网络中,输出对应的人脸深度图和表面法向量图;S5、根据输出的人脸深度图和人脸表面法向量图判断训练的空洞卷积神经网络预测精度是否符合要求:若符合结束训练;若不符合返回步骤S3继续训练。
-
公开(公告)号:CN107659774A
公开(公告)日:2018-02-02
申请号:CN201710923421.5
申请日:2017-09-30
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 基于多尺度相机阵列的视频成像系统及视频处理方法,系统包括控制云台、视频处理单元和相机阵列;相机阵列包括多个局部相机和至少一个全局参考相机;全局参考相机利用较短焦距镜头采集一预定场景的低分辨率全局参考视频,多个局部相机分别采用较长焦距镜头采集预定场景内的不同局部高分辨率视频;视频处理单元:为每一个局部相机找到其在全局参考相机中的对应区域;通过非均匀图像扭转算法将各局部视频与全局参考视频中的对应区域对齐;将扭曲后的所述较高分辨率的局部视频嵌入到所述较低分辨率的全局参考视频中,形成较高分辨率的全局视频。
-
公开(公告)号:CN107103613A
公开(公告)日:2017-08-29
申请号:CN201710192287.6
申请日:2017-03-28
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 本发明公开一种三维手势姿态估计方法,包括:S1、获取多张手势深度图并进行手势前景与背景的分割,以得到多张手势前景图并随机分为训练集和测试集;S2、按照手势模型图构建各手势前景图的实际标签图,实际标签图包含手势前景图中代表人手各参考辨识点的多个坐标点,每个坐标点的值包含对应的参考辨识点的坐标值和深度值;S3、选取训练集中的多张手势前景图对全卷积神经网络进行训练,并对应地输出多个预测标签图;S4、比较实际标签图与预测标签图之间的偏差,同时更新网络参数;S5、以不断降低偏差进行迭代,直至网络参数收敛;S6、输入待估计的手势深度图,输出对应的标签图,即为估计结果。
-
公开(公告)号:CN107024828A
公开(公告)日:2017-08-08
申请号:CN201710196808.5
申请日:2017-03-29
Applicant: 深圳市未来媒体技术研究院 , 清华大学深圳研究生院
Abstract: 本发明公开了一种可共光心的摄像机装置、全景无缝拼接组件及方法,其中摄像机装置包括摄像机、第一平面镜和第二平面镜,所述第一平面镜和第二平面镜的镜面相互平行,均垂直于所述摄像机的主光轴;所述第一平面镜位于所述摄像机的前方的预设距离处,镜面朝向所述摄像机;所述第二平面镜位于所述摄像机的镜头位置处,镜面朝向所述第一平面镜,在所述第二平面镜上设有孔洞,用于供所述摄像机拍摄图像。通过本发明的摄像机装置可以使得多个摄像机的光心重叠在一起,从而拍摄无视差的视频,进而进行无缝的全景拼接。
-
公开(公告)号:CN120071226A
公开(公告)日:2025-05-30
申请号:CN202510551655.6
申请日:2025-04-29
Applicant: 清华大学
IPC: G06V20/40 , G06V10/25 , G06V10/44 , G06V10/52 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/766 , G06V10/82 , G06V20/54 , G06V20/58 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
Abstract: 本申请公开了一种基于弹性稀疏化的宽视场高分辨视频目标智能检测方法及图像智能检测模型的训练方法、装置、存储介质、设备和计算机程序产品,包括:响应于视频图像的输入,确定视频图像在多个图像尺度下的分布特征,并根据多个分布特征确定视频图像的融合数据;根据从融合数据中确定的视频图像中目标对象的目标密度,以及多个分布特征中的目标分布特征,确定视频图像的融合数据的压缩数据;根据压缩数据,确定对视频图像中的图像目标的检测结果。本申请通过多尺度特征提取与融合和目标检测与标注,提高了检测方法在多变环境中的适应性和性能表现,在高分辨率成像应用中实现了高效、准确的目标检测,解决了检测精度和计算效率不足的问题。
-
公开(公告)号:CN119942308A
公开(公告)日:2025-05-06
申请号:CN202510423241.5
申请日:2025-04-07
Applicant: 清华大学
IPC: G06V10/82 , G06V10/764 , G06V10/145 , G06N3/067
Abstract: 本公开涉及光计算技术领域,尤其涉及一种光子智感算感神经元模型、方法与系统。其中,该模型包括聚光模块、调制模块和输入模块,其中,输入模块,用于输入预设入射光;聚光模块,用于获取目标区域中第一图像的自然光,并将自然光聚焦到调制模块中;调制模块与聚光模块和输入模块连接,用于获取聚光模块聚焦的光,并与预设入射光进行调制,得到第一调制结果。本公开通过聚光模块、调制模块和输入模块对空间强度图像进行处理,充分利用相干性和干涉效应,实现多重特征的并行处理,从而提高了图像识别效率。
-
-
-
-
-
-
-
-
-