-
公开(公告)号:CN119810369A
公开(公告)日:2025-04-11
申请号:CN202411848802.8
申请日:2024-12-13
Applicant: 北京百度网讯科技有限公司
IPC: G06T17/20 , G06N3/0464 , G06N3/08 , G06T15/20
Abstract: 本公开提供了一种数字人重建方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于数字人等场景。具体实现方案为:基于人体视频或图像构建个性化人体网格,该个性化人体网格携带该人体视频或图像中的人体特征信息;从该个性化人体网格中提取头部网格,基于该头部网格,生成对应的头部高斯表示;基于该个性化人体网格,生成对应的身体高斯表示;将该头部高斯表示和该身体高斯表示进行融合,以得到数字人的全身高斯表示。本公开能够提高数字人的人体几何形状的真实感。
-
公开(公告)号:CN119810294A
公开(公告)日:2025-04-11
申请号:CN202411786967.7
申请日:2024-12-05
Applicant: 北京百度网讯科技有限公司
IPC: G06T15/04
Abstract: 本公开提供了服饰纹理贴图生成方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于虚拟现实、数字人等场景。具体实现方案为:基于服饰参考图得到服饰特征;根据与该服饰参考图关联的坐标映射图和纹理掩码图得到纹理特征;其中,该坐标映射图包括与该服饰参考图关联的服饰模型展开的纹理贴图在该服饰模型中对应的坐标;该纹理掩码图包括基于该服饰模型展开的纹理贴图中的透明通道生成的图像;基于该服饰特征和该纹理特征,生成服饰纹理贴图。
-
公开(公告)号:CN119722880A
公开(公告)日:2025-03-28
申请号:CN202411783331.7
申请日:2024-12-05
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了三维模型的驱动方法、装置及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于三维动画等场景。具体实现方案为:获取动作视频以及三维模型的初始点云;动作视频中包括动作图像;根据动作图像以及初始点云,生成动作图像对应的动作点云;动作点云描述的动作与动作图像描述的动作一致;根据各个动作图像对应的动作点云,确定三维模型的动作点云序列;动作点云序列用于三维模型的驱动处理。
-
公开(公告)号:CN114419182B
公开(公告)日:2025-03-28
申请号:CN202210175226.X
申请日:2022-02-25
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了图像处理方法和装置,涉及图像处理、增强现实和深度学习等人工智能领域。具体实现方案为:获取样本集,其中,样本集中的样本包括样本人脸图像以及与样本人脸图像对应的标签图;从样本集中选取样本,以及执行以下训练步骤:基于初始的纹理基底将选取的样本的样本人脸图像转换成纹理图像;将纹理图像输入可微渲染器,得到渲染图;基于渲染图和选取的样本的标签图之间的差异得到所选取的样本的样本人脸图像的肤色对应的纹理基底。该实施方式能够不依赖美工师生成纹理基底,减少了人力成本。
-
公开(公告)号:CN119625180A
公开(公告)日:2025-03-14
申请号:CN202411747365.0
申请日:2024-11-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了基于大模型的三维对象生成方法、装置、设备及智能体,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于虚拟现实、3D服装生成等场景。该基于大模型的三维对象生成方法包括:对用于目标对象的初始图进行形态转换,得到表征具有指定形态的对象形态图;利用视觉大模型对初始图的对象纹理特征与对象形态图进行特征融合,得到基础目标对象图;对基础目标对象图进行多视角转换,得到与多个预设视角相关的多个扩展目标对象图;以及基于多个扩展目标对象图生成三维对象。
-
公开(公告)号:CN114549728B
公开(公告)日:2025-01-07
申请号:CN202210304129.6
申请日:2022-03-25
Applicant: 北京百度网讯科技有限公司
IPC: G06T15/04 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种图像处理模型的训练方法、图像处理方法、装置及介质。涉及计算机技术领域,具体涉及计算机视觉、深度学习、增强现实等人工智能技术领域。具体实现方案为:将样本面部图输入第一图像处理模型,获取样本面部图的纹理系数;基于纹理系数和纹理基底生成初始纹理图;将从样本面部图提取的目标区域图输入第二图像处理模型,获取样本面部图的目标对象偏移特征图;基于初始纹理图和目标对象偏移特征图,得到最终纹理图;基于最终纹理图生成样本面部图的渲染图;基于渲染图和标签渲染图构建损失函数;基于损失函数分别对第一图像处理模型和第二图像处理模型的参数进行调整。根据本公开的技术方案,能提升重建结果与原始面部的相似度。
-
公开(公告)号:CN116342782B
公开(公告)日:2024-11-12
申请号:CN202310344024.8
申请日:2023-03-31
Applicant: 北京百度网讯科技有限公司
IPC: G06T15/00 , G06T15/04 , G06T15/06 , G06T13/40 , G06V40/16 , G06V20/40 , G06T17/00 , G06N3/0895 , G06N3/09
Abstract: 本公开提供了生成虚拟形象渲染模型的方法和装置,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、数字人等场景。具体实现方案为:获取预定人物的视频;对视频进行人脸检测跟踪,得到人脸图像集合;将人脸图像集合通过三维可变形人脸模型进行三维人脸重建,得到每帧人脸图像的表情参数、纹理参数;基于每帧人脸图像的表情参数、纹理参数训练优化模型;根据三维可变形人脸模型、优化模型生成虚拟形象渲染模型。该实施方式提供了在算力成本、硬件成本、终端适配性、渲染引擎适配、收敛速度等相对其他方法都有很大优势的虚拟形象渲染模型。
-
公开(公告)号:CN117422831B
公开(公告)日:2024-11-08
申请号:CN202311435164.2
申请日:2023-10-31
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种三维眉形的生成方法及装置、电子设备和存储介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于人工智能的内容生成、数字人等场景。三维眉形的生成方法包括:获取眉形图像,眉形图像标注有多条眉毛参考线,每条眉毛参考线包括眉毛的根部点和外端点;对眉形图像进行深度估计,以得到多条眉毛参考线各自的根部点的深度值和外端点的深度值;基于多条眉毛参考线各自的根部点的深度值和外端点的深度值,生成眉形图像对应的三维眉形。
-
公开(公告)号:CN116385641B
公开(公告)日:2024-03-19
申请号:CN202310325431.4
申请日:2023-03-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图像处理方法及装置、电子设备和存储介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、数字人等场景。实现方案为:获取第一发型图像对应的第一投影图像,其中,所述第一发型图像包括目标视角下的发型,所述第一投影图像为所述发型对应的三维模型在所述目标视角下的投影图像;响应于所述第一投影图像中的待填充区域的面积大于阈值,对所述第一发型图像中的第一发型区域进行扩充,以得到目标发型区域,其中,所述待填充区域为所述第一投影图像中的第二发型区域中的未被所述第一发型区域覆盖的区域;以及基于所述目标发型区域,对所述待填充区域进行填充。
-
公开(公告)号:CN111832609B
公开(公告)日:2024-02-13
申请号:CN202010484272.9
申请日:2020-06-01
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V10/764
Abstract: 本申请公开了图像处理模型的训练的方法、装置、电子设备和存储介质,涉及深度学习和图像处理技术领域。具体实现方案为:通过将生成器生成的第二图像输入至判别器,获取第二图像中各个图像块属于真实图像的各个第一概率,并从各个图像块对应的第一概率中提取多个目标概率,根据提取的多个目标概率对判别器进行修正。由此,通过提取部分概率对判别器进行修正,不仅增加了提取的概率对应的图像块的损失的回传梯度,提高了模型生成图像的效果,而且减少了计算量。
-
-
-
-
-
-
-
-
-