一种数字人重建方法、装置、设备以及存储介质

    公开(公告)号:CN119810369A

    公开(公告)日:2025-04-11

    申请号:CN202411848802.8

    申请日:2024-12-13

    Abstract: 本公开提供了一种数字人重建方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于数字人等场景。具体实现方案为:基于人体视频或图像构建个性化人体网格,该个性化人体网格携带该人体视频或图像中的人体特征信息;从该个性化人体网格中提取头部网格,基于该头部网格,生成对应的头部高斯表示;基于该个性化人体网格,生成对应的身体高斯表示;将该头部高斯表示和该身体高斯表示进行融合,以得到数字人的全身高斯表示。本公开能够提高数字人的人体几何形状的真实感。

    服饰纹理贴图生成方法、装置、设备以及存储介质

    公开(公告)号:CN119810294A

    公开(公告)日:2025-04-11

    申请号:CN202411786967.7

    申请日:2024-12-05

    Abstract: 本公开提供了服饰纹理贴图生成方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于虚拟现实、数字人等场景。具体实现方案为:基于服饰参考图得到服饰特征;根据与该服饰参考图关联的坐标映射图和纹理掩码图得到纹理特征;其中,该坐标映射图包括与该服饰参考图关联的服饰模型展开的纹理贴图在该服饰模型中对应的坐标;该纹理掩码图包括基于该服饰模型展开的纹理贴图中的透明通道生成的图像;基于该服饰特征和该纹理特征,生成服饰纹理贴图。

    三维模型的驱动方法、装置及电子设备

    公开(公告)号:CN119722880A

    公开(公告)日:2025-03-28

    申请号:CN202411783331.7

    申请日:2024-12-05

    Abstract: 本公开提供了三维模型的驱动方法、装置及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于三维动画等场景。具体实现方案为:获取动作视频以及三维模型的初始点云;动作视频中包括动作图像;根据动作图像以及初始点云,生成动作图像对应的动作点云;动作点云描述的动作与动作图像描述的动作一致;根据各个动作图像对应的动作点云,确定三维模型的动作点云序列;动作点云序列用于三维模型的驱动处理。

    目标检测方法、模型训练方法、装置、设备及存储介质

    公开(公告)号:CN117746133B

    公开(公告)日:2024-09-24

    申请号:CN202311764274.3

    申请日:2023-12-20

    Abstract: 本公开提供了目标检测方法、模型训练方法、装置、设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于自动驾驶等场景。具体实现方案为:提取多视角图像的图像特征,对BEV空间中的预设参考点进行位置编码,得到初始化的稀疏查询,根据初始化的稀疏查询和图像特征确定输入数据,并将输入数据输入至Transformer网络的解码器,得到目标BEV特征,解码器用于对稀疏查询进行上采样,得到对应的密集查询,并基于图像特征对混合查询进行更新,更新后的混合查询用于确定目标BEV特征,基于目标BEV特征确定多视角图像的目标检测结果。

    行驶轨迹确定、模型训练方法、装置、电子设备及介质

    公开(公告)号:CN117636306A

    公开(公告)日:2024-03-01

    申请号:CN202311675223.3

    申请日:2023-12-07

    Abstract: 本公开提供了行驶轨迹确定、模型训练方法、装置、电子设备及介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于自动驾驶、自主泊车、物联网、智能交通等场景。具体实现方案为:获取针对车辆周边的目标对象配置的至少一组对象权重,对象权重表征目标对象对车辆的行驶过程的影响程度;根据环境编码向量和至少一组对象权重,对车辆的当前行驶轨迹进行调整,得到车辆的至少一个候选行驶轨迹,候选行驶轨迹具有目标评估值,环境编码向量是对车辆的周边环境信息进行编码得到的;根据至少一个候选行驶轨迹的至少一个目标评估值,确定与满足预设条件的目标评估值相对应的目标候选行驶轨迹,作为车辆的目标行驶轨迹。

    目标检测方法、装置和电子设备

    公开(公告)号:CN117541816A

    公开(公告)日:2024-02-09

    申请号:CN202311436010.5

    申请日:2023-10-31

    Abstract: 本公开提供了目标检测方法、装置和电子设备,涉及人工智能技术,尤其涉及计算机视觉、深度学习等技术领域。具体实现方案为:获取多视图图像的多尺度特征图;确定各尺度特征图在空间中的三维坐标信息,其中,每一尺度特征图的所述三维坐标信息包括该尺度特征图中每一像素点在空间中对应的多个点的三维坐标;将每一尺度特征图和该尺度特征图的三维坐标信息进行编码,根据编码结果确定多尺度特征图的三维位置感知特征;基于所述多尺度特征图的三维位置感知特征进行解码,得到多视图图像中的对象的对象类别和位置信息。有助于提高3D目标检测的准确度。

    一种自动驾驶感知模型的预训练方法、装置、设备和介质

    公开(公告)号:CN115860102B

    公开(公告)日:2023-05-23

    申请号:CN202310133636.2

    申请日:2023-02-10

    Abstract: 本公开提供了一种自动驾驶感知模型的预训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:获取至少两种模态的训练样本;其中,所述训练样本包括无标注数据;按照设定的自监督学习顺序,采用至少两种模态的无标注数据,对感知模型中的特征提取网络,进行单一模态的模态内自监督学习和模态间自监督学习,以形成预训练完成的感知模型。本方案为自动驾驶感知模型提供了一种预训练方案,能够采用无标注数据,分别进行模态内自监督学习和模态间自监督学习,实现自动驾驶感知模型的预训练。

Patent Agency Ranking