-
公开(公告)号:CN118741069A
公开(公告)日:2024-10-01
申请号:CN202410756606.1
申请日:2024-06-12
申请人: 北京达佳互联信息技术有限公司 , 中科计算技术创新研究院
IPC分类号: H04N13/275 , H04N13/282 , H04N21/81 , G06N3/096
摘要: 本公开关于一种文本输入生成动态三维视频的方法、装置、电子设备、计算机存储介质以及计算机程序产品,所述方法包括:获取文本数据,并基于文本数据生成满足文本数据的描述内容的参考视频;以文本数据和参考视频中的参考图片作为约束条件,生成满足文本数据描述和参考图片的静态三维模型;基于静态三维模型,确定动态信息生成模型;基于混合先验优化策略对动态信息生成模型优化监督,并基于优化监督后的动态信息生成模型,生成文本数据对应的三维视频;混合先验优化策略包括参考视频的直接先验和扩散模型的蒸馏先验。采用本方法,增强了三维视频的动态效果。
-
公开(公告)号:CN113643343B
公开(公告)日:2024-05-17
申请号:CN202010346542.X
申请日:2020-04-27
申请人: 北京达佳互联信息技术有限公司
IPC分类号: G06T7/50 , G06N3/08 , G06N3/0464
摘要: 本公开关于一种深度估计模型的训练方法、装置、电子设备及存储介质,以至少解决卷积神经网络对视频图像深度估计的稳定性不高的问题。该方法包括:将n个样本图像以及与n个样本图像一一对应的n个模拟图像分别输入预设深度估计模型,得到分别对应n个样本图像的深度预测结果和n个模拟图像的深度预测结果;n个样本图像和n个模拟图像标注有像素点深度值;根据每个样本图像的像素点深度值和每个样本图像的深度预测结果获得n个第一损失;根据每个样本图像的深度预测结果和与每个样本图像对应的模拟图像的深度预测结果获得n个第二损失;根据n个第一损失和n个第二损失,训练预设深度估计模型,得到第一目标深度估计模型。
-
公开(公告)号:CN113673546B
公开(公告)日:2024-04-16
申请号:CN202010411825.8
申请日:2020-05-15
申请人: 北京达佳互联信息技术有限公司
IPC分类号: G06V10/764 , G06V10/32 , G06T3/40
摘要: 本公开关于一种图像处理方法、装置、电子设备和存储介质,属于图像技术领域。该方法包括:获取待处理图像,对待处理图像中的至少两种分类对象并行进行分类处理,得到待处理图像中每种分类对象的分类结果,其中,对待处理图像中的至少一种目标分类对象并行进行多分类级别的分类处理,输出待处理图像中各分类对象的分类结果,其中,输出的每种目标分类对象的分类结果根据该目标分类对象的不同分类级别的分类结果确定。这样,对待处理图像中的至少两种分类对象并行进行分类处理,分类速度比较快,并且,综合每种目标分类对象的不同分类级别的分类结果确定输出的该种目标分类对象的分类结果,还可提升对目标分类对象的分类准确度。
-
公开(公告)号:CN117834935A
公开(公告)日:2024-04-05
申请号:CN202410010314.3
申请日:2024-01-02
申请人: 北京达佳互联信息技术有限公司
IPC分类号: H04N21/2187 , H04N21/4788 , G10L15/06 , G10L17/04 , G10L15/183 , G10L15/25 , G10L15/16 , H04N21/44 , H04N21/845
摘要: 本申请实施例公开了一种数字人直播方法、装置、电子设备及存储介质,涉及计算机技术领域。该数字人直播方法包括:在根据播放序列进行数字人直播的过程中,实时采集观众客户端发起的问题信息;该播放序列包括至少两个播放时间区间连续的播放片段;确定问题信息对应的答案信息和该答案信息的生成时间;从播放片段中确定出与该生成时间对应的第一播放片段;该生成时间处于第一播放片段的播放时间区间内;根据第一播放片段在播放序列中的序列位置,将答案信息插入至播放序列后,并将处理后的播放序列推流至观众客户端。采用本申请实施例,能够在数字人直播过程中,与观众客户端进行实时交互。
-
公开(公告)号:CN114677426A
公开(公告)日:2022-06-28
申请号:CN202210345732.9
申请日:2022-04-02
申请人: 北京达佳互联信息技术有限公司
摘要: 本公开关于一种图像处理方法、装置、电子设备及存储介质,所述方法包括:获取待处理图像对应的深度图,从深度图中确定出前景对象的第一边缘和背景对象的第二边缘;在深度图中对第一边缘的第一方向和第二边缘的第二方向分别进行第一泛洪处理,得到第一边缘泛洪后形成的前景区域和第二边缘泛洪后形成的已知背景区域,并基于前景区域确定遮挡区域;其中,遮挡区域表示被前景区域遮挡的背景区域;第一方向与第二方向相反;在深度图中通过已知背景区域对遮挡区域进行深度信息补全和RGB信息补全处理,得到遮挡区域对应的补全背景图像。本方法可准确地对图像的断层区域附近的像素点进行深度信息补全和RGB信息补全,得到更为清晰、合理的补全结果。
-
公开(公告)号:CN109948689B
公开(公告)日:2022-06-03
申请号:CN201910190595.4
申请日:2019-03-13
申请人: 北京达佳互联信息技术有限公司
摘要: 本申请是关于一种视频生成方法、装置、电子设备及存储介质,其中,该方法包括:获取对待处理图像进行深度估计得到的每个像素点的深度距离值和待处理图像中每个像素点的像素坐标值;根据每个像素点的像素坐标值和该像素点的深度距离值,计算每个像素点的相机坐标值;获取预先对待处理图像设置的多个相机坐标改变值;根据每个相机坐标改变值和每个像素点的相机坐标值,重构按照该相机坐标改变值改变后的图像;根据按照多个相机坐标改变值重构的多个图像,生成与多个图像对应的视频。从而使得生成的视频具有立体效果,提高生成的视频的观赏性。
-
公开(公告)号:CN114170349A
公开(公告)日:2022-03-11
申请号:CN202010947268.1
申请日:2020-09-10
申请人: 北京达佳互联信息技术有限公司
摘要: 本公开提供了一种图像生成方法、装置、电子设备及存储介质,涉及图像处理技术领域。方法包括:确定第一图像中第一图像区域的第一深度信息和第二图像区域的第二深度信息,第一图像区域为目标对象所在的图像区域,第二图像区域为除目标对象以外的背景图像所在的区域;根据第二图像区域的图像数据,替换第一图像区域的图像数据,得到第二图像;对第二图像中的第三图像区域进行深度填充,得到第三图像区域的第三深度信息;根据第一深度信息和第三深度信息,将第一图像区域中的图像数据融合至深度填充后的第二图像中,得到第三图像。这样,在视角变换时,能够填补背景空洞的,防止目标对象的边界处出现扭曲或缺失,优化生成的三维图像的图像效果。
-
公开(公告)号:CN110400337B
公开(公告)日:2021-10-26
申请号:CN201910618669.X
申请日:2019-07-10
申请人: 北京达佳互联信息技术有限公司
IPC分类号: G06T7/50
摘要: 本申请是关于一种图像处理方法、装置、电子设备及存储介质,获取待处理图像的每个像素的深度信息;根据所述深度信息和所述像素在图像坐标系中的二维位置,获得所述像素在图像采集装置坐标系中的像素三维位置;获取视角参数,以及对焦点的对焦三维位置;其中,视角参数为与待处理图像对应的固定观察视角不同的视角的参数;根据所述对焦三维位置、所述视角参数以及所述像素三维位置,获得所述像素的偏移后的三维位置;分别根据每个像素的所述偏移后的三维位置,将每个像素投影至待处理图像的二维坐标系中,得到目标图像。通过本方案能够实现待处理图像中的场景具有不同的观察视角所对应的不同展示效果。
-
公开(公告)号:CN110264505A
公开(公告)日:2019-09-20
申请号:CN201910486072.4
申请日:2019-06-05
申请人: 北京达佳互联信息技术有限公司
IPC分类号: G06T7/50
摘要: 本公开关于一种单目深度估计方法、装置、电子设备及存储介质。该方法中,利用深度估计模型对单目视频的视频帧进行深度估计;该深度估计模型,基于预设样本帧、预设样本帧对应的对抗样本帧以及预设样本帧的标注深度数据训练获得;在训练时,基于预设样本帧的估计深度数据和所对应对抗样本帧的估计深度数据之间的差异,预设样本帧的标注深度数据和估计深度数据之间的差异,判断训练中的深度估计模型是否收敛;如果收敛,完成训练;其中,对抗样本帧为:对预设样本帧进行数据增广处理得到的样本帧。本公开可以在保证准确性的前提下,有效抑制单目深度估计结果中的抖动,且省去了对视频帧进行滤波平滑处理所引入的计算量。
-
公开(公告)号:CN109727208A
公开(公告)日:2019-05-07
申请号:CN201811505873.2
申请日:2018-12-10
申请人: 北京达佳互联信息技术有限公司
IPC分类号: G06T5/00
摘要: 本公开是关于一种滤镜推荐方法、装置、电子设备及存储介质。其中方法包括:接收到为原始图像增加滤镜的指令后,在预置图像特征包含的类别中,识别所述原始图像所属的类别;依据预设的类别与智能滤镜的对应关系,查询所述原始图像所属的类别对应的智能滤镜;根据查询到的智能滤镜进行滤镜推荐。本公开可以根据原始图像的类别进行智能滤镜的推荐,推荐过程更加客观,推荐的智能滤镜能够更加适应原始图像的情况,推荐结果准确,能够提升用户体验。
-
-
-
-
-
-
-
-
-