-
公开(公告)号:CN112634255B
公开(公告)日:2022-12-02
申请号:CN202011614591.3
申请日:2020-12-30
Applicant: 清华大学 , 中国人民解放军总医院
Abstract: 本申请提出一种脑部病灶检测模型的建立方法、装置、计算机设备和存储介质。其中,方法通过使用小规模的标注数据,采用协同训练的方式同时训练一个自然语言处理NLP模型和一个卷积模型,在每一次迭代中,利用NLP模型和卷积模型从剩余未标注数据集中选择部分数据更新到训练集,继续训练,进而将完成训练的卷积模型作为脑部病灶检测模型。由此通过利用配对的CT影像与报告中的文本信息,进行协同训练,以实现脑部CT病灶的自动检测的方法;在模块训练时,只需要少量数据标注,便可以对大规模数据进行训练,大大节省了深度学习过程中的数据标注工作量。
-
公开(公告)号:CN115100088A
公开(公告)日:2022-09-23
申请号:CN202210514255.4
申请日:2022-05-11
Applicant: 清华大学
IPC: G06T5/50 , G06V10/774 , G06V40/16 , G06V10/82 , G06T3/00
Abstract: 本申请公开了一种可控人脸合成方法、装置、电子设备及存储介质,其中,方法包括:获取至少一张人脸在styleGAN模型中的隐空间向量;从隐空间向量中解耦至少一张人脸的标识信息和差异信息;控制标识信息不变的同时,随机变化差异信息,生成人脸可控合成结果。由此,解决了相关技术中人脸属性的丰富度较低,导致生成的人脸与真实人脸相比缺乏变化,难以满足应用需求的技术问题。
-
公开(公告)号:CN115099401A
公开(公告)日:2022-09-23
申请号:CN202210522533.0
申请日:2022-05-13
Applicant: 清华大学
Abstract: 本申请涉及一种基于世界建模的持续学习框架的学习方法、装置及设备,方法包括:将获取的目标数据分为多个训练阶段数据;确定当前训练阶段对应的训练阶段数据,并利用当前训练阶段对应的训练阶段数据同时训练任务模型、世界模型和机理模型;使用前一训练阶段对应的训练阶段数据训练的世界模型进行数据采样,生成与第一训练阶段对应的训练阶段数据至前一训练阶段对应的训练阶段数据相同分布的采样数据,并使用前一训练阶段数据训练的机理模型,对当前训练阶段数据和采样数据处理,得到任务模型上对采样数据的采样梯度响应;基于同时训练的任务模型、世界模型和机理模型,通过采样梯度响应来控制任务模型的学习进程。由此,可以实现持续学习的目标。
-
公开(公告)号:CN112541958B
公开(公告)日:2022-09-09
申请号:CN202011522571.3
申请日:2020-12-21
Applicant: 清华大学
Abstract: 本申请提出一种三维人脸的参数化建模方法和装置,涉及图像处理技术领域,其中,方法包括:对每一人脸图像进行局部分区,建立每个人脸局部分区对应的局部训练编码器;从预先建立的偏置贴图中获取每一人脸图像对应的人脸偏置贴图,通过局部训练编码器分别对人脸偏置贴图进行编码,获取低维度特征向量;通过训练解码器对低维度特征向量、每一人脸图像对应的标注年龄和表情进行处理,获取重建偏置贴图;根据重建偏置贴图和人脸偏置贴图的误差对局部训练编码器和训练解码器的参数进行调整。由此,可以拟合低质量的人脸扫描数据恢复高质量的细节,生成的细节应用到双线性模型上,生成带细节的人脸动画。
-
公开(公告)号:CN114973355A
公开(公告)日:2022-08-30
申请号:CN202210483528.3
申请日:2022-05-05
Applicant: 清华大学
Abstract: 本申请公开了一种人脸嘴部重建方法及装置,其中,方法包括:采集目标对象各个表情的多视角图像;根据多视角图像获取目标对象的2D嘴部特征点,并基于2D嘴部特征点计算目标对象的3D嘴部特征点;由3D嘴部特征点生成嘴部特征向量,并利用嘴部特征向量重建最终的不透明度与表面颜色值,生成人脸嘴部重建图像。由此,解决了相关技术中对于由嘴部运动引起的拓扑变化的处理效果较差,嘴部动态重建精度较低,不利于表情运动迁移的技术问题。
-
公开(公告)号:CN114511526A
公开(公告)日:2022-05-17
申请号:CN202210080197.9
申请日:2022-01-24
Abstract: 本发明公开了一种基于深度学习的动脉瘤分割方法和装置,其中,该方法包括:获取头部扫描CT血管造影CTA图像;将CTA图像输入到预训练的深度学习模型,基于预训练的深度学习模型对CTA图像进行图像分析处理;其中,预训练的深度学习模型是基于全局定位损失和局部分割损失两个损失函数训练得到,基于图像分析处理,使用动脉瘤分割网络输出相应的脑动脉瘤区域识别分割标签图像。本发明使用CTA图像作为输入,利用三维卷积分割网络和全局定位描述子,能够快速精确检测和分割动脉瘤。
-
公开(公告)号:CN114413897A
公开(公告)日:2022-04-29
申请号:CN202210312218.5
申请日:2022-03-28
Applicant: 清华大学
Abstract: 本申请涉及人体运动捕捉技术领域,特别涉及一种稀疏IMU实时人体动作捕捉方法、装置及设备,包括:根据采集的左手腕处、右手腕处、左膝下部、右膝下部、头部和腰部处的惯性传感器检测惯性数据得到骨骼在人体本地坐标系中的骨骼朝向和加速度,将骨骼朝向和加速度对齐到根节点坐标系下;将对齐后的骨骼朝向和加速度代入反向动力学的多阶段姿态求解器,分阶段预测人体的末端关节坐标、全部关节坐标,求解人体姿态;将对齐后的骨骼朝向和加速度及末端关节坐标、全部关节坐标和人体姿态代入预设的多分支运动求解器,求解人体运动;基于人体姿态和人体运动得到实时人体动作捕捉结果,解决了商业动捕设备无法满足普通消费者日常动作捕捉需求的问题。
-
公开(公告)号:CN114399462A
公开(公告)日:2022-04-26
申请号:CN202111460563.5
申请日:2021-12-02
Applicant: 清华大学
Abstract: 本申请提出了一种基于深度表征网络的医学影像异常检测方法,涉及计算机视觉、深度学习和医学影像智能分析交叉技术领域,其中,该方法包括:采集待检测医学影像;对采集的医学影像进行规范化处理,生成规范化图像;将规范化图像输入训练好的深度异常检测网络中,对输入影像数据进行诊断,判断输入影像是否异常。采用上述方案的本申请提出的基于正常医学图像的异常检测方法有助于打破医疗资源和水平分布不均的限制,同时实现多类疾病异常检测,为医生提供辅助和支撑,对提高临床诊断准确性具有重要的意义。
-
公开(公告)号:CN114332321A
公开(公告)日:2022-04-12
申请号:CN202111401637.8
申请日:2021-11-19
Applicant: 清华大学
Abstract: 本发明公开了一种基于神经纹理的动态人脸重建方法和装置,其中,该方法包括:预先采集多视角的人脸视频数据集;基于人脸视频数据集,利用二维神经纹理渲染网络和三维神经纹理渲染网络,对人脸视频数据集进行训练,得到二维神经纹理贴图和三维神经纹理场双层神经纹理,以及双层神经纹理对应的解码网络;基于训练得到的双层神经纹理和对应的解码网络,利用人脸混合模型构建三维仿射变形场,实现动态人脸的驱动。本发明将渲染结果合并则可得到目标光照下的具有真实感的渲染结果。
-
公开(公告)号:CN110728203B
公开(公告)日:2022-04-12
申请号:CN201910900738.6
申请日:2019-09-23
Applicant: 清华大学 , 中国人民解放军总医院
Abstract: 本发明公开了一种基于深度学习的手语翻译视频生成方法及系统,其中,该方法包括:通过数据集的手语视频循环训练变分自编码器模型和环状生成对抗网络模型,直至达到预设维度,输出图像低维特征序列;通过数据集的语言文本序列训练语言翻译模型,输出与图像低维特征序列对应的文本低维特征序列,以构建语言文本序列与手语视频的映射关系;基于映射关系,将待测语言文本序列输入语言翻译模型,映射出待测语言文本序列对应的图像低维特征序列,视频模型解码图像低维特征序列,生成对应的手语视频。本发明实施例的方法通过构建压缩隐空间来对图像进行降维处理,解决视频生成问题对计算机存储与计算能力的极高要求,可以使用通用语言模型进行翻译训练。
-
-
-
-
-
-
-
-
-