-
公开(公告)号:CN118741069A
公开(公告)日:2024-10-01
申请号:CN202410756606.1
申请日:2024-06-12
申请人: 北京达佳互联信息技术有限公司 , 中科计算技术创新研究院
IPC分类号: H04N13/275 , H04N13/282 , H04N21/81 , G06N3/096
摘要: 本公开关于一种文本输入生成动态三维视频的方法、装置、电子设备、计算机存储介质以及计算机程序产品,所述方法包括:获取文本数据,并基于文本数据生成满足文本数据的描述内容的参考视频;以文本数据和参考视频中的参考图片作为约束条件,生成满足文本数据描述和参考图片的静态三维模型;基于静态三维模型,确定动态信息生成模型;基于混合先验优化策略对动态信息生成模型优化监督,并基于优化监督后的动态信息生成模型,生成文本数据对应的三维视频;混合先验优化策略包括参考视频的直接先验和扩散模型的蒸馏先验。采用本方法,增强了三维视频的动态效果。
-
公开(公告)号:CN114066957A
公开(公告)日:2022-02-18
申请号:CN202010784818.2
申请日:2020-08-06
申请人: 北京达佳互联信息技术有限公司
发明人: 刘继文
IPC分类号: G06T7/50
摘要: 本公开关于图像深度信息的确定方法、装置、电子设备和存储介质,所述方法包括:获取历史帧图像中特征区域内像素点的深度值,该历史帧图像在目标视频中位于目标帧图像之前,且目标帧图像中包含匹配于特征区域的目标区域;按照特征区域和所述目标区域的对应关系将深度值映射到目标区域,生成对应于目标帧图像的深度值集合,该深度值集合中记录有目标区域内目标点的位置信息和深度值;基于目标帧图像中各个像素点的颜色值和上述深度值集合,确定目标帧图像对应的目标深度图。该方法能够避免运动区域存在断层或难以对齐的问题;而且因为在深度预测过程中具有自纠错能力,所以具有较高的深度预测准确度。
-
公开(公告)号:CN113538467A
公开(公告)日:2021-10-22
申请号:CN202110927330.5
申请日:2021-08-09
申请人: 北京达佳互联信息技术有限公司
发明人: 刘继文
摘要: 本公开关于一种图像分割方法和装置、图像分割模型的训练方法和装置、电子设备以及计算机可读存储介质。该图像分割方法包括:获取待分割图像和待分割图像中的指定点的坐标信息;获取待分割图像的第一深度图;将待分割图像、待分割图像中的指定点的坐标信息以及第一深度图输入到图像分割模型中,由图像分割模型确定指定点在待分割图像中的三维空间中所在的平面在待分割图像中所对应的区域。由此能够不受图像纹理和语义类别的限制,进行准确的图像分割。
-
公开(公告)号:CN116758207A
公开(公告)日:2023-09-15
申请号:CN202310577580.X
申请日:2023-05-22
申请人: 北京达佳互联信息技术有限公司
发明人: 刘继文
摘要: 本公开关于一种图像渲染模型的训练方法、图像渲染方法、装置、电子设备及存储介质,所述方法包括:获取针对目标对象的训练数据样本,并根据训练数据样本对图像渲染模型进行预训练,得到满足预训练完成条件的图像渲染模型;根据满足预训练完成条件的图像渲染模型得到目标对象对应的深度图像,构建目标对象的点云数据;根据目标对象的点云数据对目标对象进行表面重建,得到目标对象的表面重建结果,并基于目标对象的表面重建结果确定目标对象对应的目标采样点;基于目标采样点,对满足预训练完成条件的图像渲染模型进行训练,得到训练完成的图像渲染模型。采用本方法,提高了图像渲染模型的训练效率。
-
公开(公告)号:CN114937072A
公开(公告)日:2022-08-23
申请号:CN202210592041.9
申请日:2022-05-27
申请人: 北京达佳互联信息技术有限公司
发明人: 刘继文
摘要: 本公开关于一种图像处理方法和装置、电子设备、计算机可读存储介质,图像处理方法包括:对目标图像进行深度估计处理,得到目标图像的每个像素点的预估深度值和预估偏移量;根据目标图像的每个像素点的预估偏移量,确定相应像素点的偏移像素点;将目标图像中每个像素点的偏移像素点对应的预估深度值,作为相应像素点的修正深度值;基于目标图像的每个像素点的修正深度值,得到目标图像的深度图。本公开可同时预估深度图和深度图的偏移量,并通过预估的偏移量来修正预估深度图上深度值的分布,从而在耗费很小计算量的情况下消除过渡带,提升深度图清晰度。
-
-
-
-