-
公开(公告)号:CN117671156A
公开(公告)日:2024-03-08
申请号:CN202311786470.0
申请日:2023-12-22
Applicant: 长安大学
IPC: G06T17/00 , G06N3/0464
Abstract: 本发明公开了一种基于扩散模型的物体三维结构生成方法及系统,通过获取待生成三维结构场景的三通道图像中离散深度值处的特征;基于卷积神经网络获取图像中每个像素点的深度分布,根据相机坐标系和世界坐标系之间的转换关系将所得特征投影至三维空间,得到融合特征后的三维体素栅格;将随机生成高斯噪声和获取的三维体素栅格输入至预训练扩散模型进行预测,对获取的预测值进行T次降噪即可获得待生成三维场景的三维结构信息;本发明将观测的二维图像信息投影至规则的三维体素栅格,基于场景局部观测图像进行三维重建,可有效减少对多视图获取的依赖,过程清晰可靠、可解释性强、可迁移性强,具有训练高效、收敛速度快的优点。