-
公开(公告)号:CN114399574B
公开(公告)日:2024-06-25
申请号:CN202111490835.6
申请日:2021-12-08
Applicant: 清华大学
IPC: G06T13/40
Abstract: 本申请提出了一种为单个人脸扫描数据生成带细节表情动画的方法,涉及计算机图形学技术领域,其中,该方法包括:采集单个人脸扫描数据;对单个人脸扫描数据进行预处理,得到原始偏置贴图和人脸网格;使用一段含有人脸动作的视频提取人脸表情,生成一段表情系数序列;将原始偏置贴图和表情系数序列输入训练好的深度网络中,输出的图像作为新的偏移贴图;将人脸网格和所述新的偏移贴图导入至动画软件进行渲染,得到每一帧的动画结果,将所有的动画结果进行拼接,获得人脸动画视频。采用上述方案的本申请只需要输入用户在任意表情下采集到的单一扫描数据,即可生成各种表情下的表情动画,可以降低动画制作的成本,对三维人脸动画进行加速和数据压缩。
-
公开(公告)号:CN114332321B
公开(公告)日:2024-06-07
申请号:CN202111401637.8
申请日:2021-11-19
Applicant: 清华大学
Abstract: 本发明公开了一种基于神经纹理的动态人脸重建方法和装置,其中,该方法包括:预先采集多视角的人脸视频数据集;基于人脸视频数据集,利用二维神经纹理渲染网络和三维神经纹理渲染网络,对人脸视频数据集进行训练,得到二维神经纹理贴图和三维神经纹理场双层神经纹理,以及双层神经纹理对应的解码网络;基于训练得到的双层神经纹理和对应的解码网络,利用人脸混合模型构建三维仿射变形场,实现动态人脸的驱动。本发明将渲染结果合并则可得到目标光照下的具有真实感的渲染结果。
-
公开(公告)号:CN116245141B
公开(公告)日:2024-06-04
申请号:CN202310074506.6
申请日:2023-01-13
Applicant: 清华大学
IPC: G06N3/0455 , G06N3/096
Abstract: 本申请涉及深度学习技术领域,特别涉及一种迁移学习架构、方法、电子设备及存储介质,其中,迁移学习架构包括:一个或多个上游任务模型,每个上游任务模型包括多头注意力机制层,且多头注意力机制层整层扩展为专家网络层;下游任务模型,下游任务模型包括与多头注意力机制层层数相同的专家融合层,专家融合层与多头注意力机制层的每层对应,每层专家融合层中专家网络通过迁移所有上游任务模型的多头注意力机制层的对应层得到。由此,解决了相关技术中只能迁移一个上游任务模型,无法同时利用多个上游模型,对上游模型能力要求高等问题。
-
公开(公告)号:CN118097775A
公开(公告)日:2024-05-28
申请号:CN202410125009.9
申请日:2024-01-29
Applicant: 清华大学
IPC: G06V40/20 , G06V10/80 , G06V10/82 , G06V10/40 , G06V10/62 , G06N3/0455 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了人体体型感知稀疏IMU动作捕捉方法及系统,该方法,包括获取同步、校准和对齐后的人体的IMU惯性测量值;将IMU惯性测量值输入至循环神经网络进行人体姿态求解以估计人体运动姿态;利用编码器网络对提取的循环神经网络的隐藏状态和拼接的人体体型信息进行融合,以根据融合结果更新循环神经网络;利用更新后的循环神经网络对人体运动姿态进行优化以得到的人体动作捕捉结果。本发明可以对于不同体型的人体动作捕捉更重要的信息,提高系统动作捕捉的准确性和可靠性。
-
公开(公告)号:CN114010180B
公开(公告)日:2024-04-26
申请号:CN202111306129.1
申请日:2021-11-05
Applicant: 清华大学
Abstract: 本发明公开了一种基于卷积神经网络的磁共振快速成像方法及装置,其中,该方法包括:采集磁共振图像,对磁共振图像进行傅里叶变换得到k空间数据;零初始化长度为k空间数据行数的浮点类型向量,以构建图像重建网络,对k空间数据进行采样,对采样后的k空间数据进行傅里叶逆变换得到图像,输入图像重建网络,得到输出;计算图像重建网络的输出与目标图像的L1距离作为损失函数;根据训练得到的浮点类型向量得到二值采样向量,对磁共振仪编写采样序列,将采集的磁共振图像输入图像重建网络中,得到输出的高质量磁共振图像。本发明在实际使用中,按照磁共振采样序列采集磁共振图像,将图像输入到磁共振图像重建网络中,得到清晰的磁共振图像。
-
公开(公告)号:CN113052831B
公开(公告)日:2024-04-23
申请号:CN202110401742.5
申请日:2021-04-14
Applicant: 清华大学 , 中国人民解放军总医院第一医学中心
IPC: G06T7/00 , G16H30/20 , G06N3/0455 , G06N3/0464 , G06N3/088
Abstract: 本申请提出一种脑部医学影像异常检测方法、装置、设备及存储介质,其中,具体实现方案为:获取未包含病灶的脑部三维医学影像样本;构建自编码器模型,初始化自编码器模型的模型参数,并将脑部三维医学影像样本作为输入和目标以训练所述自编码器模型;获取待检测脑部医学影像,并获取待检测脑部医学影像之中的病灶候选区域掩码图像;将待检测脑部医学影像输入至经过训练的自编码器模型,获得重构图像,并根据病灶候选区域掩码图像计算重构图像与待检测脑部医学影像间的重构误差;根据重构误差检测待检测脑部医学影像是否存在病灶。本申请降低了异常检测的实现难度和成本,同时提高了准确率。
-
公开(公告)号:CN113689539B
公开(公告)日:2024-04-19
申请号:CN202110761086.X
申请日:2021-07-06
Applicant: 清华大学
Abstract: 本发明公开了一种基于隐式光流场的动态场景实时三维重建方法,其中,方法包括:对动态场景进行拍摄获得深度图像,并将深度图像转换为三维点云;使用预先训练的光流估计网络,计算得到相邻两帧图像之间的稠密光流;根据稠密光流和深度图像,反投影得到图像可见部分的三维场景流;根据图像可见部分的三维场景流和重建得到的三维模型,使用隐式光流估计网络预测三维模型表面上所有顶点的三维运动;构建能量函数,优化从标准模型到三维点云的非刚性变形参数;通过深度图像对标准模型进行更新和补全,得到更新后的三维模型。该方法基于隐式光流场的动态场景实时三维重建方法能够准确鲁棒地完成对动态场景的重建,具有实时的运算性能,适用性广。
-
公开(公告)号:CN117036591A
公开(公告)日:2023-11-10
申请号:CN202310805103.4
申请日:2023-06-30
Applicant: 清华大学
Abstract: 本申请涉及计算机视觉领域,特别涉及一种基于数据驱动的三维人脸表达模型嘴部表现增强方法,包括:获取包含人脸说话动作的RGB视频,重建RGB视频对应的人脸扫描序列,并根据人脸扫描序列生成与目标线性模型相同拓扑的人脸网格序列,基于预设的目标人脸表达模型,对人脸网格序列进行拟合,并计算拟合结果和人脸网格序列之间的残差,并根据残差增强人脸表达模型的嘴部表现。由此,解决了现阶段人脸重建及表达工作较少考虑到嘴部区域,导致嘴部区域效果不好的问题,改进人脸表达模型,通过提升数据量就能够很好地提升模型表达能力,增强后的人脸线性表达模型能够直接应用到对应的原始工作上。
-
公开(公告)号:CN116958351A
公开(公告)日:2023-10-27
申请号:CN202310814053.6
申请日:2023-07-04
Applicant: 清华大学
Abstract: 本申请涉及计算机图形学和深度学习技术领域,特别涉及一种从手机视频构建可重光照虚拟化身的方法、装置及设备,包括:对无光待训练视频序列和有光待训练视频序列进行预处理,确定多个标定参数;基于多个标定参数,训练无光待训练视频序列得到可驱动的虚拟化身,并训练有光待训练视频序列得到可重光照虚拟化身;根据可驱动的虚拟化身和可重光照虚拟化身构建可驱动且可重光照虚拟化身。由此,解决了由于神经辐射场只能表达静态场景,并且无法在新的光照条件下重新渲染场景等问题,能够得到可以被动态驱动且可以重光照的虚拟化身,显著提升新光照条件下虚拟化身的渲染质量,产生更逼真的人脸高光,为远程会议等应用赋能。
-
公开(公告)号:CN116912391A
公开(公告)日:2023-10-20
申请号:CN202310730256.7
申请日:2023-06-19
Applicant: 清华大学
IPC: G06T15/06
Abstract: 本申请涉及一种结合神经辐射场和可导路径跟踪的逆向渲染方法及装置,其中,方法包括:从多个视角采集目标环境光照下的静态物体,得到多张静态物体图像;根据静态物体图像求解物体的几何、材质和周围环境的环境光照;根据物体的几何、材质和周围环境的环境光照得到物体在任一光照和/或视角下的渲染合成结果。由此,解决了相关技术中,基于物理的渲染方法需要采样很多条光路,并且每个光路要递归很多层,由于光路多且长,可导渲染的计算时间、内存往往很大而难以在消费级计算机上承受,且神经辐射场没有显式的材质表示,不能进行重光照,无法实现对物体新光照、新视角下的渲染合成等问题。
-
-
-
-
-
-
-
-
-