一种三维人体数据生成方法、装置、存储介质及电子设备

    公开(公告)号:CN117893696A

    公开(公告)日:2024-04-16

    申请号:CN202410301175.X

    申请日:2024-03-15

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种三维人体数据生成方法、装置、存储介质及电子设备。所述三维人体数据生成方法包括:获取患者的基础图片数据,根据基础图片数据中包含的患者的姿态信息,确定构建患者的三维人体模型所需的每个体积原语的配置参数,并根据配置参数构建患者的目标三维人体模型,根据预先确定的目标运动数据,驱动目标三维人体模型做出相应的动作,并生成目标运动数据对应的在指定视角下患者的视频数据,目标运动数据包括不同运动姿态下患者的关节节点的坐标,根据视频数据、目标运动数据,生成患者的三维人体数据集,从而可以降低获取患者的三维人体数据的难度。

    一种基于对称视图的三维重建方法、装置及存储介质

    公开(公告)号:CN117893692A

    公开(公告)日:2024-04-16

    申请号:CN202410281175.8

    申请日:2024-03-12

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种基于对称视图的三维重建方法、装置及存储介质,在本说明书提供的方法中,生成模型包括编码层、生成层、聚合层和渲染层,确定第一初始模型在第一视图的相机坐标系的各坐标面上的第一投影特征,第二初始模型在第二视图的相机坐标系的各坐标面上的第二投影特征,对各第一投影特征和各第二投影特征进行空间对齐,确定全局特征,将全局特征输入渲染层,得到三维模型。这样,通过将各第一投影特征和各第二投影特征进行空间对齐,可得到包含重建目标物全局三维空间信息的全局特征,根据全局特征可渲染出重建目标物的三维模型,不需要不同视角视图的重叠部分进行空间对齐,减少了三维重建所需的视图数量,提高了三维重建效率。

    一种三维人体康复数据集构建方法及装置

    公开(公告)号:CN117854666A

    公开(公告)日:2024-04-09

    申请号:CN202410262492.5

    申请日:2024-03-07

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种三维人体康复数据集构建方法及装置。在本说明书提供的三维人体康复数据集构建方法中,通过红外采集设备采集目标用户在执行预设的各标准动作时的动作捕捉数据,并通过视频采集设备采集目标用户在执行各标准动作时的目标视频;对目标视频进行裁剪,得到若干动作视频,其中,每个动作视频中包含目标用户在执行一个标准动作时的视频内容;针对每个动作视频,根据该动作视频中目标用户执行的标准动作确定该动作视频的动作标签;根据动作捕捉数据与该动作视频,确定与该动作视频的动作标签对应的二维人体关键点数据和三维人体网格数据;根据动作标签、二维人体关键点数据与三维人体网格数据,构建三维人体康复数据集。

    一种用于视频的三维人体重建模型的训练方法及装置

    公开(公告)号:CN117726760A

    公开(公告)日:2024-03-19

    申请号:CN202410175200.4

    申请日:2024-02-07

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种用于视频的三维人体重建模型的训练方法及装置,重建模型至少包含特征提取层、运动增强层和回归层,针对每个图像序列,根据该图像序列的初始特征对应的第一张量的帧数轴、高度轴和宽度轴,确定所述初始特征的序列特征元,根据各序列特征元的运动增强特征,得到样本视频中预测三维人体的重建视频,根据各图像序列的速度损失和样本视频的三维重建损失训练该重建模型。在得到各图像序列的初始特征后,以序列特征元为单位,对同一通道的同一图像序列包含的各帧图像的特征进行特征增强,增强了同一图像序列中各帧图像之间联系,并根据速度损失来监督重建模型对帧间连续性的增强。

    一种多视角图像生成模型的训练方法、应用方法

    公开(公告)号:CN117372631A

    公开(公告)日:2024-01-09

    申请号:CN202311673946.X

    申请日:2023-12-07

    Inventor: 王宏升 林峰

    Abstract: 本说明书公开了一种多视角图像生成模型的训练方法、应用方法,待训练的生成模型至少包括加噪层、交叉注意力层和去噪层,将各视角的初始特征图、时间参数和各视角的噪声图像,输入加噪层,可以得到各视角的加噪特征图,将各视角的加噪特征图与各视角的初始特征图,输入交叉注意力层,得到各视角二维空间语义增强的各第二融合特征图,将各第二融合特征图输入去噪层,可以得到各视角的预测噪声图像。训练完成的生成模型的去噪层,可用于根据目标图像、随机生成的各噪声图像和时间参数,生成目标图像对应的各视角的生成图像,且各视角的生成图像具有较强的一致性约束。

    一种基于硬件特性的数据处理的方法及装置

    公开(公告)号:CN116126750B

    公开(公告)日:2023-08-22

    申请号:CN202310199473.8

    申请日:2023-02-24

    Inventor: 王宏升 陈光 林峰

    Abstract: 本说明书公开了一种基于硬件特性的数据处理的方法及装置。首先,获取各待处理数据以及确定高速缓冲存储器中所能缓存的数据大小,待处理数据用于表示神经网络模型执行运算任务所需的数据。其次,在神经网络模型执行运算任务时,按照数据大小,对各待处理数据进行切分,得到各切分数据。而后,针对每个切分数据,将该切分数据缓存到高速缓冲存储器中,得到缓存后的切分数据,以使处理器基于数据大小对缓存后的切分数据进行运算,得到运算结果。最后,根据运算结果,进行数据处理。本方法可以提高数据处理的效率。

    一种模型部署的方法、系统、存储介质及电子设备

    公开(公告)号:CN116126365B

    公开(公告)日:2023-07-28

    申请号:CN202310413623.0

    申请日:2023-04-18

    Inventor: 王宏升 陈光

    Abstract: 本说明书公开了一种模型部署的方法、系统、存储介质及电子设备,包括:响应于用户的输入操作,确定待部署模型的部署信息。先根据待部署模型的模型信息,将待部署模型转换为中间表示模型。再根据用户选择的目标部署引擎的引擎信息,对中间表示模型进行转换,生成目标部署引擎支持的目标模型。使得待部署模型可以由不同的目标部署引擎进行模型部署,从而在后续过程中,只需对目标模型进行编译,得到可执行文件。再在目标硬件上运行可执行文件,以对待部署模型进行部署。

    集群任务的并行执行方法、装置、计算机设备和存储介质

    公开(公告)号:CN116227585B

    公开(公告)日:2023-07-25

    申请号:CN202310519360.1

    申请日:2023-05-10

    Inventor: 王宏升 陈光

    Abstract: 本申请涉及一种集群任务的并行执行方法、装置、计算机设备和存储介质。所述方法包括:确定逻辑张量的配置信息;对逻辑张量进行跨层级分布,在逻辑张量从当前层级设备分布到目标层级设备的情况下,确定当前层级设备对应的源逻辑张量和目标层级设备对应的目标逻辑张量;针对于配置信息中的至少一种目标属性,若源逻辑张量和目标逻辑张量所针对的至少一种目标属性不同,则对至少一种目标属性进行转换,得到张量跨层级分布的转换子图。采用本方法能够在满足多层级关系的计算节点下分布式训练场景的需求的同时,提高分布式训练的效率。

    一种任务执行系统、方法、存储介质及电子设备

    公开(公告)号:CN116185532B

    公开(公告)日:2023-07-21

    申请号:CN202310439553.6

    申请日:2023-04-18

    Inventor: 王宏升 陈光

    Abstract: 本说明书公开了一种任务执行系统、方法、存储介质及电子设备。所述任务执行系统包括:编译模块、调用模块、目标编译器接口、目标启动接口以及至少两种计算引擎,编译模块用于获取模型数据并进行编译,得到第一可执行代码,调用模块用于调用至少一种计算引擎作为目标引擎,目标引擎用于通过目标编译器接口,将第一可执行代码的格式转换为目标代码格式,并通过目标引擎对第一可执行代码进行编译,得到第二可执行代码,以及获取目标模型对应算子的核函数以及各算子间的依赖信息,通过目标启动接口,将依赖信息的格式转换为目标信息格式,将核函数的格式转换为目标核函数格式,基于核函数、依赖信息以及第二可执行代码执行计算任务。

    一种模型推理交互方法、电子设备、可读存储介质

    公开(公告)号:CN116362336A

    公开(公告)日:2023-06-30

    申请号:CN202310645642.6

    申请日:2023-06-02

    Inventor: 王宏升 陈光

    Abstract: 本发明涉及一种模型推理交互方法、电子设备、可读存储介质,所述方法应用于服务端,包括如下步骤:接收推理请求信息,从包括多个中间表示形式的深度学习模型的模型仓库中加载所述推理请求信息中指定的深度学习模型;根据所述推理请求信息从包括多个推理引擎的推理引擎库中加载指定的推理引擎,将中间表示形式的深度学习模型转换为与所述推理引擎匹配的形式;采用所述推理引擎对所述深度学习模型进行推理,发送与所述推理请求信息要求的形式相匹配的输出张量信息。与现有技术相比,本发明能够实现基于服务端的,针对深度学习模型的高效和灵活推理,同时具有安全性高、吞吐量大、调用方便、响应速度快等优点。

Patent Agency Ranking