基于相机阵列的高动态十亿像素视频采集方法及装置

    公开(公告)号:CN108156383A

    公开(公告)日:2018-06-12

    申请号:CN201711481644.7

    申请日:2017-12-29

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于相机阵列的高动态十亿像素视频采集方法及装置,多尺度相机阵列具有参考相机和至少一个长焦相机,其中,方法包括以下步骤:通过镜头焦距差距对所示至少一个长焦相机的长焦相机图像进行降采样;通过匹配算法获取至少一个长焦相机在参考相机中的位置;将对参考相机中的位置的图像块进行上采样,得到参考块;将长焦相机图像与参考块对齐,以将长焦相机图像嵌入参考相机图像中,并进行图像增强与颜色校正,得到视频采集结果。该方法可以实现十亿像素的视频合成,大大提高了相机阵列的灵活性,使得相机可以自由分配到有需要的区域,增加了CMOS传感器的利用率,且具有非常高的并行度。

    基于骨架跟踪的动态实时三维人体重建方法及系统

    公开(公告)号:CN108122275A

    公开(公告)日:2018-06-05

    申请号:CN201711408848.8

    申请日:2017-12-22

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于骨架跟踪的动态实时三维人体重建方法及系统,其中,方法包括:对人体进行深度图拍摄以得到单张深度图像;将单张深度图像变换为三维点云,并获取三维点云和重建模型顶点之间的匹配点对;根据匹配点对建立能量函数,共同求解重建模型上每一个顶点的非刚性运动位置变换参数和人体骨架运动参数;对能量函数进行求解,以根据求解结果将重建模型与三维点云进行对齐,并使用深度图更新和补全对齐后的模型,以实现三维人体重建。该方法可以利用深度相机对人体进行拍摄,从而获得深度图像作为系统输入信息,并基于该深度图像完成对动态人体进行实时三维重建的功能,求解准确鲁棒,简单易实现。

    高动态范围十亿像素视频生成方法

    公开(公告)号:CN107734271A

    公开(公告)日:2018-02-23

    申请号:CN201710958201.6

    申请日:2017-10-16

    Abstract: 一种高动态范围十亿像素视频生成方法,包括:用多个局部视角相机进行正常采集视频,用中心全局相机进行变曝光采集,使用不同长度的曝光时间对全局进行多次曝光采样,获得不同强度范围入射光的细节;对中心全局相机得到的变曝光采集到的视频图像进行曝光融合,得到全局高动态范围低时域噪声的视频图像;对未进行变曝光采集的局部视频图像预处理,按照设定的比例缩小,利用零均值归一化互相关匹配找到缩小后图像在变曝光融合后的全局图中的位置,从全局图中裁剪出最佳匹配块,放大到与局部视频图像同样大小,作为参考块;对局部视频图像进行特征点提取匹配及变换,利用图割技术将局部视频图像进行拼接。该方法可以得到高动态范围的十亿像素视频。

    基于空洞卷积神经网络的人脸深度和表面法向量预测方法

    公开(公告)号:CN107679477A

    公开(公告)日:2018-02-09

    申请号:CN201710889248.1

    申请日:2017-09-27

    Abstract: 基于空洞卷积神经网络的人脸深度和表面法向量预测方法,包括训练空洞卷积神经网络的步骤:S1、搭建一空洞卷积神经网络,包括依次连接的多个卷积层、多个空洞卷积层和多个反卷积层,其中,每个卷积层均连接有一规范化操作和一激励操作;S2、初始化空洞卷积神经网络的权重值;S3、将训练图片输入空洞卷积神经网络中,以最小化代价函数为目标对所述空洞卷积神经网络进行迭代训练;每迭代一次则更新一次权重值;S4、将测试图片输入训练得到的空洞卷积神经网络中,输出对应的人脸深度图和表面法向量图;S5、根据输出的人脸深度图和人脸表面法向量图判断训练的空洞卷积神经网络预测精度是否符合要求:若符合结束训练;若不符合返回步骤S3继续训练。

    一种三维手势姿态估计方法

    公开(公告)号:CN107103613A

    公开(公告)日:2017-08-29

    申请号:CN201710192287.6

    申请日:2017-03-28

    Abstract: 本发明公开一种三维手势姿态估计方法,包括:S1、获取多张手势深度图并进行手势前景与背景的分割,以得到多张手势前景图并随机分为训练集和测试集;S2、按照手势模型图构建各手势前景图的实际标签图,实际标签图包含手势前景图中代表人手各参考辨识点的多个坐标点,每个坐标点的值包含对应的参考辨识点的坐标值和深度值;S3、选取训练集中的多张手势前景图对全卷积神经网络进行训练,并对应地输出多个预测标签图;S4、比较实际标签图与预测标签图之间的偏差,同时更新网络参数;S5、以不断降低偏差进行迭代,直至网络参数收敛;S6、输入待估计的手势深度图,输出对应的标签图,即为估计结果。

    光子智感算感神经元模型、方法与系统

    公开(公告)号:CN119942308A

    公开(公告)日:2025-05-06

    申请号:CN202510423241.5

    申请日:2025-04-07

    Applicant: 清华大学

    Inventor: 方璐 王熠晨 吴蔚

    Abstract: 本公开涉及光计算技术领域,尤其涉及一种光子智感算感神经元模型、方法与系统。其中,该模型包括聚光模块、调制模块和输入模块,其中,输入模块,用于输入预设入射光;聚光模块,用于获取目标区域中第一图像的自然光,并将自然光聚焦到调制模块中;调制模块与聚光模块和输入模块连接,用于获取聚光模块聚焦的光,并与预设入射光进行调制,得到第一调制结果。本公开通过聚光模块、调制模块和输入模块对空间强度图像进行处理,充分利用相干性和干涉效应,实现多重特征的并行处理,从而提高了图像识别效率。

Patent Agency Ranking