针对三维构建模型的模型训练方法、装置、存储介质

    公开(公告)号:CN117876610B

    公开(公告)日:2024-05-24

    申请号:CN202410281172.4

    申请日:2024-03-12

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种针对三维构建模型的模型训练方法、装置、存储介质,其中,首先获取人体视图集,人体视图集中包括目标人体的前视图和后视图;从人体视图集中确定第一视图以及第二视图,第一视图和第二视图所对应的采集视角不同;确定第一视图对应的采集视角,作为第一目标视角,并获取采集视角位于第一目标视角邻域范围内的针对目标人体所采集到的视图,作为第一参照视图,然后将各视图输入到待训练的三维构建模型中进行特征提取,最后以最小化第二视图对应的图像特征与第一参照视图对应的图像特征之间的相似度,以及最大化第一视图对应的图像特征与第一参照视图对应的图像特征之间的相似度为优化目标,对三维构建模型进行训练。

    一种三维人体建模的方法、装置、存储介质及电子设备

    公开(公告)号:CN117911630B

    公开(公告)日:2024-05-14

    申请号:CN202410308245.4

    申请日:2024-03-18

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种三维人体建模的方法、装置、存储介质及电子设备,具体包括:确定人体视频序列中各视频图像的人体特征数据和背景特征数据。通过稳定扩散模型根据人体特征数据和背景特征数据生成各视频图像的人体图像和背景图像,进而确定出每个人体图像针对各人体图像的人体特征权重值,以及确定出每个背景图像针对各背景图像的背景特征权重值。根据人体图像和人体特征权重值,生成人体建模数据,根据背景图像和背景特征权重值,生成背景建模数据。根据人体建模数据和背景建模数据,构建三维视频人体模型。通过本说明书中的方法可以有效利用时间维度的更深层次的有用信息,极大程度上提升了三维人体视频模型与真实人体之间的相似度和准确性。

    模型训练方法、业务执行方法、装置、介质及设备

    公开(公告)号:CN117975202A

    公开(公告)日:2024-05-03

    申请号:CN202410388685.5

    申请日:2024-04-01

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了模型训练方法、业务执行方法、装置、介质及设备,专用设备通过将获取的初始残缺点云数据进行填充处理,得到待处理点云数据,而后将待处理点云数据以及该待处理点云数据所需的去噪次数N输入到待训练的点云处理模型中进行去噪,进而得到第一输出点云数据,根据此第一输出点云数据以及初始残缺点云数据对应的标签点云数据,即可对点云处理模型进行训练。训练后的点云处理模型可以将残缺点云数据对应的待处理点云数据去噪,从而获取残缺点云对应的去噪后的点云数据。该去噪后的点云数据相对于残缺点云数据更加完整,可通过此去噪后的点云数据作为还原点云数据,从而构建人体模型,进而执行目标业务。

    一种点云的处理方法、装置、存储介质及电子设备

    公开(公告)号:CN117934858A

    公开(公告)日:2024-04-26

    申请号:CN202410329387.9

    申请日:2024-03-21

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种点云的处理方法、装置、存储介质及电子设备,获取目标物的原始粗略点云,将原始粗略点云输入三维表面生成模型的特征提取层,以使特征提取层提取原始粗略点云在若干平面上的平面特征。将平面特征输入三维表面生成模型的流变换层,以使该流变换层对平面特征进行变换,得到变换后的平面特征,并使该流变换层对变换后的平面特征进行去噪,得到去噪后的平面特征。将去噪后的平面特征输入三维表面生成模型的结果预测层,得到结果预测层输出的目标物的最终精准点云。该方法使得得到的最终精准点云构成的目标物的三维表面更精确,也即提高了最终精准点云构成的目标物的形状与目标物的真实形状相似度。

    一种三维人体数据生成方法、装置、存储介质及电子设备

    公开(公告)号:CN117893696A

    公开(公告)日:2024-04-16

    申请号:CN202410301175.X

    申请日:2024-03-15

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种三维人体数据生成方法、装置、存储介质及电子设备。所述三维人体数据生成方法包括:获取患者的基础图片数据,根据基础图片数据中包含的患者的姿态信息,确定构建患者的三维人体模型所需的每个体积原语的配置参数,并根据配置参数构建患者的目标三维人体模型,根据预先确定的目标运动数据,驱动目标三维人体模型做出相应的动作,并生成目标运动数据对应的在指定视角下患者的视频数据,目标运动数据包括不同运动姿态下患者的关节节点的坐标,根据视频数据、目标运动数据,生成患者的三维人体数据集,从而可以降低获取患者的三维人体数据的难度。

    一种基于对称视图的三维重建方法、装置及存储介质

    公开(公告)号:CN117893692A

    公开(公告)日:2024-04-16

    申请号:CN202410281175.8

    申请日:2024-03-12

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种基于对称视图的三维重建方法、装置及存储介质,在本说明书提供的方法中,生成模型包括编码层、生成层、聚合层和渲染层,确定第一初始模型在第一视图的相机坐标系的各坐标面上的第一投影特征,第二初始模型在第二视图的相机坐标系的各坐标面上的第二投影特征,对各第一投影特征和各第二投影特征进行空间对齐,确定全局特征,将全局特征输入渲染层,得到三维模型。这样,通过将各第一投影特征和各第二投影特征进行空间对齐,可得到包含重建目标物全局三维空间信息的全局特征,根据全局特征可渲染出重建目标物的三维模型,不需要不同视角视图的重叠部分进行空间对齐,减少了三维重建所需的视图数量,提高了三维重建效率。

    一种三维人体康复数据集构建方法及装置

    公开(公告)号:CN117854666A

    公开(公告)日:2024-04-09

    申请号:CN202410262492.5

    申请日:2024-03-07

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种三维人体康复数据集构建方法及装置。在本说明书提供的三维人体康复数据集构建方法中,通过红外采集设备采集目标用户在执行预设的各标准动作时的动作捕捉数据,并通过视频采集设备采集目标用户在执行各标准动作时的目标视频;对目标视频进行裁剪,得到若干动作视频,其中,每个动作视频中包含目标用户在执行一个标准动作时的视频内容;针对每个动作视频,根据该动作视频中目标用户执行的标准动作确定该动作视频的动作标签;根据动作捕捉数据与该动作视频,确定与该动作视频的动作标签对应的二维人体关键点数据和三维人体网格数据;根据动作标签、二维人体关键点数据与三维人体网格数据,构建三维人体康复数据集。

    一种用于视频的三维人体重建模型的训练方法及装置

    公开(公告)号:CN117726760A

    公开(公告)日:2024-03-19

    申请号:CN202410175200.4

    申请日:2024-02-07

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种用于视频的三维人体重建模型的训练方法及装置,重建模型至少包含特征提取层、运动增强层和回归层,针对每个图像序列,根据该图像序列的初始特征对应的第一张量的帧数轴、高度轴和宽度轴,确定所述初始特征的序列特征元,根据各序列特征元的运动增强特征,得到样本视频中预测三维人体的重建视频,根据各图像序列的速度损失和样本视频的三维重建损失训练该重建模型。在得到各图像序列的初始特征后,以序列特征元为单位,对同一通道的同一图像序列包含的各帧图像的特征进行特征增强,增强了同一图像序列中各帧图像之间联系,并根据速度损失来监督重建模型对帧间连续性的增强。

    视频合并方法、装置、计算机设备以及存储介质

    公开(公告)号:CN117544821A

    公开(公告)日:2024-02-09

    申请号:CN202311462639.7

    申请日:2023-11-03

    Abstract: 本申请涉及一种视频合并方法、装置、计算机设备以及存储介质。所述方法包括:采集候选视频,并确定候选视频的视频名称;根据候选视频的视频名称将候选视频存入存储系统的视频文件夹中;确定候选视频的视频元数据,并根据视频元数据对视频文件夹中的候选视频进行更新,确定视频文件夹对应的目标视频;根据关键词从视频文件夹中确定目标文件夹,并从目标文件夹对应的目标视频中确定期望视频;根据预设的目标视频尺寸和目标视频分辨率确定期望视频的排列方式,基于排列方式对期望视频进行合并,确定组合视频,并对组合视频进行可视化展示。提高了组合视频播放的流畅度,并且提高了组合视频的视频播放质量。

    一种多视角图像生成模型的训练方法、应用方法

    公开(公告)号:CN117372631A

    公开(公告)日:2024-01-09

    申请号:CN202311673946.X

    申请日:2023-12-07

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种多视角图像生成模型的训练方法、应用方法,待训练的生成模型至少包括加噪层、交叉注意力层和去噪层,将各视角的初始特征图、时间参数和各视角的噪声图像,输入加噪层,可以得到各视角的加噪特征图,将各视角的加噪特征图与各视角的初始特征图,输入交叉注意力层,得到各视角二维空间语义增强的各第二融合特征图,将各第二融合特征图输入去噪层,可以得到各视角的预测噪声图像。训练完成的生成模型的去噪层,可用于根据目标图像、随机生成的各噪声图像和时间参数,生成目标图像对应的各视角的生成图像,且各视角的生成图像具有较强的一致性约束。

Patent Agency Ranking