三维模型生成方法及装置、存储介质及电子设备

    公开(公告)号:CN116597087A

    公开(公告)日:2023-08-15

    申请号:CN202310587122.4

    申请日:2023-05-23

    发明人: 张琦 刘巧俏 邹航

    摘要: 本公开提供了一种三维模型生成方法及装置、存储介质及电子设备,涉及场景构建技术领域。该方法包括:获取目标对象的图像以及对应的描述信息,其中,描述信息用于描述目标对象的形状信息和/或外观信息;对目标对象的图像以及对应的描述信息进行特征提取,得到目标对象的形状特征编码和外观特征编码;基于形状特征编码、外观特征编码和目标对象的重建视角,利用神经辐射场方法进行三维隐式重建,生成目标对象的三维模型。本公开生成的目标对象的三维模型能够符合用户的需求,而非随机生成的内容,灵活性大大提高,应用性也大大提高。

    图像处理方法、装置、计算机可读存储介质及电子设备

    公开(公告)号:CN116630514A

    公开(公告)日:2023-08-22

    申请号:CN202310596577.2

    申请日:2023-05-24

    IPC分类号: G06T15/20 G06T17/00

    摘要: 本申请属于人工智能领域,涉及图像处理方法、装置、存储介质及电子设备。该方法包括:获取待处理图像、与所述待处理图像对应的预设相机位姿和视角信息;将所述待处理图像、所述预设相机位姿和所述视角信息输入至三维重建模型,通过所述三维重建模型根据所述预设相机位姿和所述视角信息确定与所述待处理图像对应的色彩信息和深度信息,并根据所述色彩信息和所述深度信息渲染生成与所述待处理图像对应且具有所述视角信息的二维图像。本申请能够提高三维重建的效率和质量,保证视角一致性。

    图像处理方法及装置、存储介质及电子设备

    公开(公告)号:CN116597173A

    公开(公告)日:2023-08-15

    申请号:CN202310587506.6

    申请日:2023-05-23

    IPC分类号: G06V10/62 G06V10/52 G06V10/82

    摘要: 本公开提供了一种图像处理方法、装置、电子设备及存储介质。该方法包括:获取携带时间信息的待处理图像和目标视角;在待处理图像的原视角下构建待处理图像的多个空间点,并根据时间信息和各空间点的空间坐标确定各空间点的时空特征;根据各空间点的时空特征确定各空间点属于各个运动域的概率以及在各个运动域下的运动特征;其中运动域包括:静态域、刚体运动域和非刚体运动域;根据概率和运动特征确定各空间点的运动组合特征;根据目标视角、各空间点的空间坐标和各空间点的运动组合特征进行渲染,获得在目标视角下的待处理图像的重绘图像。该方法可以将待处理图像空间点的运动组合特征作为依据进行分类渲染,从而提高处理效率,节省计算资源。

    图像生成方法及装置、存储介质和电子设备

    公开(公告)号:CN115272575B

    公开(公告)日:2024-03-29

    申请号:CN202210900092.3

    申请日:2022-07-28

    发明人: 张琦 刘巧俏 邹航

    摘要: 本公开提供了一种图像生成方法、图像生成装置、存储介质和电子设备,涉及图像处理技术领域。该图像生成方法包括:获取与待生成图像对应的相机位姿,根据相机位姿确定与待生成图像中各像素点对应的射线;针对每条射线上的采样点,根据采样点的位置信息确定采样点的特征信息;特征信息根据输入图像的视觉特征信息确定出,视觉特征信息包括输入图像的像素点的二维特征信息、三维体素特征信息、三维表面特征信息中的至少一种;根据采样点的位置信息和特征信息,确定采样点的色彩信息和密度信息;利用射线上各采样点的色彩信息和密度信息,确定待生成图像中与射线对应的像素点的色彩信息,以生成待生成图像。本公开可以提升生成新视角图像的效果。

    模型的训练方法、训练装置、电子设备和可读存储介质

    公开(公告)号:CN115439610A

    公开(公告)日:2022-12-06

    申请号:CN202211116815.7

    申请日:2022-09-14

    发明人: 邹航 刘巧俏 张琦

    IPC分类号: G06T17/00 G06N3/04 G06N3/08

    摘要: 本公开提供了一种模型的训练方法、训练装置、电子设备和可读存储介质,涉及机器学习技术领域。其中,人脸三维构建模型的训练方法包括:获取多项编码信息,多项编码信息包括基于图像采集设备获取到的光线的方向编码和采样编码,以及采集到的人脸形状编码和人脸外观编码;基于多项编码信息进行网络模型的模型训练,并使网络模型输出多角度人脸训练特征;基于多角度人脸训练特征和待重建人脸二维图像计算网络模型的模型损失;将模型损失输入网络模型进行反向传播,以迭代更新网络模型的模型参数,直至网络模型收敛,得到人脸三维构建模型。通过本公开的技术方案,在降低方案实施成本的同时,保证了三维重构操作的实用性与可靠性。

    图像生成方法及装置、存储介质和电子设备

    公开(公告)号:CN115272576A

    公开(公告)日:2022-11-01

    申请号:CN202210901664.X

    申请日:2022-07-28

    发明人: 张琦 刘巧俏 邹航

    IPC分类号: G06T17/00 G06T15/00

    摘要: 本公开提供了一种图像生成方法、图像生成装置、存储介质和电子设备,涉及图像处理技术领域。该图像生成方法包括:获取与待生成图像对应的相机位姿,根据相机位姿确定与待生成图像中各像素点对应的射线;针对每条射线上的采样点,根据采样点的位置信息确定采样点的空间语义信息;根据采样点的位置信息和空间语义信息,确定采样点的色彩信息和密度信息;利用射线上各采样点的色彩信息和密度信息,确定待生成图像中与射线对应的像素点的色彩信息,以生成待生成图像。本公开可以提升生成新视角图像的效果。

    身份认证方法、装置、存储介质及电子设备

    公开(公告)号:CN114186211A

    公开(公告)日:2022-03-15

    申请号:CN202111539906.7

    申请日:2021-12-15

    IPC分类号: G06F21/32

    摘要: 本公开提供了一种身份认证方法、装置、存储介质及电子设备,涉及人工智能技术领域。该方法通过接收多模态数字助理发送的用户的多模态身份信息及环境中的语音信息;根据用户的多模态身份信息及环境中的语音信息,生成身份认证信息及用户操作权限;将身份认证信息及用户操作权限发送给智能体;智能体接收用户身份认证信息及用户操作权限后,在各自的系统上进行登记及鉴权。本公开实施例能够对智能体的多模态身份信息进行统一认证。

    移动设备的导航方法、设备、系统及介质

    公开(公告)号:CN114674333B

    公开(公告)日:2023-12-08

    申请号:CN202210285208.7

    申请日:2022-03-22

    IPC分类号: G01C21/34 G05D1/02 G05D1/03

    摘要: 本公开提供了一种移动设备的导航方法、设备、系统及介质,涉及人工智能领域。该方法包括:确定移动设备响应于全局规划指令到达目标区域边缘,全局规划指令是云端设备基于全局场景信息进行全局路径规划得到的;基于目标区域的局部场景信息进行局部路径规划,生成局部控制指令;向移动设备发送局部控制指令,以使移动设备响应于局部控制指令由目标区域边缘移动至目标区域内的目标终点。根据本公开实施例,能够减轻云端设备的导航负荷。

    图像生成方法及装置、存储介质和电子设备

    公开(公告)号:CN115272575A

    公开(公告)日:2022-11-01

    申请号:CN202210900092.3

    申请日:2022-07-28

    发明人: 张琦 刘巧俏 邹航

    摘要: 本公开提供了一种图像生成方法、图像生成装置、存储介质和电子设备,涉及图像处理技术领域。该图像生成方法包括:获取与待生成图像对应的相机位姿,根据相机位姿确定与待生成图像中各像素点对应的射线;针对每条射线上的采样点,根据采样点的位置信息确定采样点的特征信息;特征信息根据输入图像的视觉特征信息确定出,视觉特征信息包括输入图像的像素点的二维特征信息、三维体素特征信息、三维表面特征信息中的至少一种;根据采样点的位置信息和特征信息,确定采样点的色彩信息和密度信息;利用射线上各采样点的色彩信息和密度信息,确定待生成图像中与射线对应的像素点的色彩信息,以生成待生成图像。本公开可以提升生成新视角图像的效果。

    智能交互系统及方法、电子设备、存储介质

    公开(公告)号:CN114398175A

    公开(公告)日:2022-04-26

    申请号:CN202111658784.3

    申请日:2021-12-30

    IPC分类号: G06F9/50

    摘要: 本公开提供了一种智能交互系统及方法、电子设备、存储介质,涉及人工智能技术领域。该智能交互系统包括:边缘智能终端;多模态交互模块,用于获取目标对象输入的多模态交互数据;中央调度模块,与多模态交互模块通信连接,用于通过所述多模态交互数据确定至少一个交互指令,并根据交互指令匹配并调度至少一个边缘智能终端,以使边缘智能终端执行交互指令。本公开实施例的技术方案能够响应更加复杂的多模态交互指令,提高目标对象与边缘智能终端之间的沟通交互能力,提升对边缘智能终端的控制调度能力,保证边缘智能终端执行指令效率以及执行准确度,同时可以降低边缘智能终端的复杂程度以及制造成本。