-
公开(公告)号:CN118229815B
公开(公告)日:2025-05-09
申请号:CN202410317079.4
申请日:2024-03-19
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种视频生成方法,涉及人工智能技术领域,尤其涉及深度学习和计算机视觉技术领域,可应用于人工智能视频生成场景。具体实现方案为:基于图像特征、文本特征、以及图像中目标对象的动作特征,生成目标对象的动作序列;确定动作序列的运动控制特征,运动控制特征用于控制所生成的视频中的目标对象的动作与动作序列一致;以及基于图像特征、文本特征以及运动控制特征,生成目标视频。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。
-
公开(公告)号:CN118229815A
公开(公告)日:2024-06-21
申请号:CN202410317079.4
申请日:2024-03-19
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种视频生成方法,涉及人工智能技术领域,尤其涉及深度学习和计算机视觉技术领域,可应用于人工智能视频生成场景。具体实现方案为:基于图像特征、文本特征、以及图像中目标对象的动作特征,生成目标对象的动作序列;确定动作序列的运动控制特征,运动控制特征用于控制所生成的视频中的目标对象的动作与动作序列一致;以及基于图像特征、文本特征以及运动控制特征,生成目标视频。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。
-
公开(公告)号:CN117745943A
公开(公告)日:2024-03-22
申请号:CN202311764196.7
申请日:2023-12-20
Applicant: 北京百度网讯科技有限公司
Inventor: 储文青
Abstract: 本公开提供了三维对象重建方法、深度学习模型的训练方法、装置,涉及人工智能技术领域,尤其涉及计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于AI导航、元宇宙等场景。实现方案为:基于驱动参数和待重建对象的三维参数,得到融合三维参数,待重建对象的三维参数是基于包含待重建对象的原始图像得到的;基于融合三维参数,得到初始重建图像,初始重建图像包括重建对象;基于重建对象和待重建对象之间的光流信息与原始图像,得到光流重建图像;以及基于光流重建图像、初始重建图像和原始图像,生成目标重建图像,目标重建图像包括目标重建对象,目标重建对象包括待重建对象的标识信息和驱动参数所表征的信息。
-
-