双目图像的视差估计方法、装置、设备及可读存储介质

    公开(公告)号:CN116309770A

    公开(公告)日:2023-06-23

    申请号:CN202310064978.3

    申请日:2023-01-31

    Abstract: 本申请公开了一种双目图像的视差估计方法、装置、设备及可读存储介质。该方法包括:根据特征提取网络提取左视图的多个尺度的左视图特征图以及右视图的多个尺度的右视图特征图;对于多级立体匹配网络的目标立体匹配网络,根据目标立体匹配网络进行匹配代价的计算,得到代价体,基于目标立体匹配网络的门控循环单元根据视差假设和代价体,按照梯度下降算法对目标立体匹配网络的初始视差图进行迭代更新,得到输出视差图,该视差假设是在视差空间中按照全局稀疏采样得到的或者是进行超亚像素级别的局部密集的连续采样得到的;对最后一级立体匹配网络的输出视差图进行上采样处理,得到视差图。采用本申请的方案,提高了双目图像的视差估计的准确度。

    音频处理方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN115442710A

    公开(公告)日:2022-12-06

    申请号:CN202210940071.4

    申请日:2022-08-05

    Abstract: 本申请实施例公开了一种音频处理方法、装置、电子设备及计算机可读存储介质,该方法包括:获取第一音频设备采集的第一音频数据,以及第二音频设备采集的第二音频数据,其中,第一音频设备与净声源的第一采集距离小于第二音频设备与所述净声源的第二采集距离,且第一音频设备与噪声源的第一干扰距离大于第二音频设备与噪声源的第二干扰距离;将第一音频数据和第二音频数据输入到音频降噪模型,得到第一音频数据对应的降噪音频数据。通过与声源距离不同的第一音频数据和第二音频数据的采集,并利用第一音频数据和第二音频数据这两个音频数据进行音频降噪处理,相较于相关技术中单个音频数据的降噪处理,提升了音频的降噪效果。

    直播方法、装置、存储介质、电子设备及产品

    公开(公告)号:CN115442658A

    公开(公告)日:2022-12-06

    申请号:CN202210934650.8

    申请日:2022-08-04

    Abstract: 本申请公开了一种直播方法、装置、存储介质、电子设备及产品,涉及互联网技术领域,该方法包括:获取体积视频,所述体积视频用于展示三维直播对象的直播行为;获取三维虚拟场景,所述三维虚拟场景用于展示三维场景内容;将所述体积视频与所述三维虚拟场景组合,得到包含所述直播行为及所述三维场景内容的三维直播内容;基于所述三维直播内容生成三维直播画面,所述三维直播画面用于在直播平台播放。本申请可以有效提升虚拟直播效果。

    数字人生成方法、装置和存储介质

    公开(公告)号:CN119295615A

    公开(公告)日:2025-01-10

    申请号:CN202411402296.X

    申请日:2024-10-09

    Abstract: 本申请实施例提供了一种数字人生成方法、装置和存储介质;本申请实施例在获取到目标对象的表情驱动信号和肢体驱动信号后,可以对表情驱动信号和肢体驱动信号进行融合,然后,一方面从融合后信号中提取高斯参数,得到高斯参数变化量,另一方面,从骨骼动画模型中获取预设标准对象在标准动作姿态下的高斯参数,再然后,便可以根据该高斯参数变化量、以及标准对象在标准动作姿态下的高斯参数,计算出目标对象在目标动作姿态下的高斯参数,并据此渲染出目标对象在目标动作姿态下的二维图像,得到目标对象对应的数字人;该方案不仅可以提高数字人的生成效率,而且,还可以提高渲染质量。

    视频处理方法、装置、计算机设备、存储介质和产品

    公开(公告)号:CN116389704A

    公开(公告)日:2023-07-04

    申请号:CN202211610280.9

    申请日:2022-12-14

    Abstract: 本申请实施例公开了一种视频处理方法、装置、计算机设备、存储介质和产品,通过获取包含拍摄对象的体积视频,以及获取作为体积视频的候选背景的全景图像帧;对体积视频中的拍摄对象进行运动检测,以得到拍摄对象的运动特征信息;根据运动特征信息对全景图像帧进行图像调整处理,得到与拍摄对象的运动匹配的调整后全景图像帧;将体积视频和调整后全景图像帧进行融合,得到以调整后全景图像帧为背景的融合后体积视频。本申请实施例通过将与拍摄对象的运动匹配的调整后全景图像帧与体积视频进行融合,得到的融合后体积视频包含有与拍摄对象运动匹配的背景,使得体积视频的内容更加丰富,观看效果更好。

    视频播放方法、装置、计算机设备及计算机可读存储介质

    公开(公告)号:CN116233532A

    公开(公告)日:2023-06-06

    申请号:CN202211611347.0

    申请日:2022-12-14

    Abstract: 本申请实施例提供一种视频播放方法、装置、计算机设备及计算机可读存储介质,本申请实施例可以获取对象在体积视频中待播放视频帧对应的对象骨骼模型;若对体积视频的当前视频帧播放完成,则获取对象骨骼模型对应的解码完成的对象显示特征图像,对象显示特征图像为解码完成的图像;根据对象显示特征图像和对象骨骼模型,构建对象的对象显示三维模型;根据对象显示三维模型,对待播放视频帧进行播放。本申请实施例能够在体积视频的当前视频帧播放完成时,获取解码完成的对象显示特征图像,如此能够基于解码完成的对象显示特征图像和对象骨骼模型,快速地构建对象显示三维模型,从而能够提高度体积视频的播放效率,以及减少播放体积视频的资源消耗。

    体积视频的视频合拍方法、装置和计算机可读存储介质

    公开(公告)号:CN116233395A

    公开(公告)日:2023-06-06

    申请号:CN202310214498.0

    申请日:2023-03-07

    Abstract: 本申请实施例公开了一种体积视频的视频合拍方法、装置和计算机可读存储介质;本申请实施例通过获取虚拟对象对应的体积视频;基于体积视频构建视频合拍画面,视频合拍画面包括虚拟对象以及虚拟对象对应的合拍对象;获取合拍对象的位置信息,并基于位置信息和视频合拍画面,计算虚拟对象相对于合拍对象的虚拟对象位置信息;根据虚拟对象位置信息,投射出虚拟对象对应的位置指示信息,位置指示信息用于在视频合拍过程中为合拍对象指示虚拟对象的当前位置;基于位置指示信息生成合拍对象和虚拟对象的合拍视频。以此,基于虚拟对象的位置指示信息实现合拍对象在视频合拍过程中与虚拟对象的互动,提升视频合拍体验,进而提升视频合拍的效果。

    视频处理方法、装置及计算机可读存储介质

    公开(公告)号:CN116129011A

    公开(公告)日:2023-05-16

    申请号:CN202310080231.7

    申请日:2023-02-01

    Abstract: 本申请公开了一种视频处理方法、装置及计算机可读存储介质,方法通过获取目标视频的模型压缩数据以及纹理压缩数据;对模型压缩数据进行解压缩,得到模型关键帧以及骨骼动画,并基于模型关键帧与骨骼动画生成模型动画;对纹理压缩数据进行解压缩,得到纹理视频;基于纹理视频对模型动画进行贴图,得到目标视频。以此,本申请提供的视频处理方法,通过将三维视频的多帧模型数据转换为模型关键帧与骨骼动画,从而大大降低需要传输的模型的数据量;在需要对视频进行使用或播放时,可以根据模型关键帧和骨骼动画实现对多帧模型数据的还原。如此可以大大提升视频的处理效率。

Patent Agency Ranking