-
公开(公告)号:CN111277912B
公开(公告)日:2021-12-31
申请号:CN202010096887.4
申请日:2020-02-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/81
Abstract: 本申请公开了图像处理方法、装置和电子设备,涉及图像处理技术领域。具体实现方案为:获取第一合成音频;将所述第一合成音频输入至预测模型中,获得预测唇形索引;所述预测模型的训练样本包括第二合成音频,以及与所述第二合成音频对应的唇形索引,所述唇形索引根据对发音对象的唇部采集的唇形图像获得;根据所述预测唇形索引,获得目标唇形图像;将所述目标唇形图像,投影到预获取的目标面部上,获得合成面部图像。由于根据预测模型可获取到与第一合成音频对应的预测唇形索引,并进一步的根据预测唇形索引获得目标唇形图像,使得合成的合成面部图像的唇形与第一合成音频的匹配度更高,提高了真人虚拟形象的合成效果。
-
公开(公告)号:CN111368137A
公开(公告)日:2020-07-03
申请号:CN202010088384.2
申请日:2020-02-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/738 , G06F16/783 , G06K9/62
Abstract: 本申请公开了一种视频的生成方法、装置、电子设备及可读存储介质,涉及计算机视觉技术。具体实现方案为获取待生成视频中目标对象的脸部图像的三维脸部网格和所述脸部图像的脸部图像纹理;根据所述目标对象的音频内容的音频特征,获得所述脸部图像的各表情参数;根据所述脸部图像的三维脸部网格、所述脸部图像的各表情参数和所述脸部图像的脸部图像纹理,获得所述三维脸部网格的各渲染脸部图像;对所述三维人脸网格的各渲染人脸图像和模板视频的各视频帧图像进行融合处理,以获得融合之后的各融合视频帧图像;以及对所述各融合视频帧图像进行合成处理,以生成融合视频。
-
公开(公告)号:CN111294665B
公开(公告)日:2021-07-20
申请号:CN202010088388.0
申请日:2020-02-12
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种视频的生成方法、装置、电子设备及可读存储介质,涉及计算机视觉技术。具体实现方案获取待生成视频中目标对象的脸部图像的三维脸部网格和所述脸部图像的脸部图像纹理;根据所述目标对象的音频内容的音频特征,获得所述脸部图像的各二维唇形参数;根据所述脸部图像的各二维唇形参数,获得所述脸部图像的各三维表情参数;根据所述脸部图像的三维脸部网格、所述脸部图像的各三维表情参数和所述脸部图像的脸部图像纹理,获得所述三维脸部网格的各渲染脸部图像;对所述三维人脸网格的各渲染人脸图像和模板视频的各视频帧图像进行融合处理,以获得融合之后的各融合视频帧图像;以及对所述各融合视频帧图像进行合成处理,以生成融合视频。
-
公开(公告)号:CN111354370B
公开(公告)日:2021-06-25
申请号:CN202010091799.5
申请日:2020-02-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种唇形特征预测方法、装置和电子设备,涉及虚拟技术领域。具体实现方案为:识别语音特征的PPG;使用神经网络模型对所述PPG进行预测,以预测到语音特征的唇形特征,其中,所述神经网络模型为使用训练样本进行训练得到输入包括PPG,输出包括唇形特征的神经网络模型,所述训练样本包括PPG训练样本和唇形特征训练样本。本申请可以提高预测唇形特征的准确性。
-
公开(公告)号:CN109255830B
公开(公告)日:2020-06-05
申请号:CN201811011717.0
申请日:2018-08-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 彭哲
Abstract: 本申请实施例公开了三维人脸重建方法和装置。该方法的一具体实施方式包括:将获取的二维人脸图像输入已训练的人脸三维重建模型,得到与用于构建三维人脸模型的特征向量对应的特征系数,其中,特征向量基于对人脸三维重建模型的训练得出,基于特征向量和对应的特征系数构建二维人脸图像对应的三维人脸模型。该实施方式实现了用于构建三维人脸模型的特征向量的表达能力的提升,从而可以构建出更准确、更多样化的三维人脸模型。
-
公开(公告)号:CN111294665A
公开(公告)日:2020-06-16
申请号:CN202010088388.0
申请日:2020-02-12
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种视频的生成方法、装置、电子设备及可读存储介质,涉及计算机视觉技术。具体实现方案获取待生成视频中目标对象的脸部图像的三维脸部网格和所述脸部图像的脸部图像纹理;根据所述目标对象的音频内容的音频特征,获得所述脸部图像的各二维唇形参数;根据所述脸部图像的各二维唇形参数,获得所述脸部图像的各三维表情参数;根据所述脸部图像的三维脸部网格、所述脸部图像的各三维表情参数和所述脸部图像的脸部图像纹理,获得所述三维脸部网格的各渲染脸部图像;对所述三维人脸网格的各渲染人脸图像和模板视频的各视频帧图像进行融合处理,以获得融合之后的各融合视频帧图像;以及对所述各融合视频帧图像进行合成处理,以生成融合视频。
-
公开(公告)号:CN111277912A
公开(公告)日:2020-06-12
申请号:CN202010096887.4
申请日:2020-02-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/81
Abstract: 本申请公开了图像处理方法、装置和电子设备,涉及图像处理技术领域。具体实现方案为:获取第一合成音频;将所述第一合成音频输入至预测模型中,获得预测唇形索引;所述预测模型的训练样本包括第二合成音频,以及与所述第二合成音频对应的唇形索引,所述唇形索引根据对发音对象的唇部采集的唇形图像获得;根据所述预测唇形索引,获得目标唇形图像;将所述目标唇形图像,投影到预获取的目标面部上,获得合成面部图像。由于根据预测模型可获取到与第一合成音频对应的预测唇形索引,并进一步的根据预测唇形索引获得目标唇形图像,使得合成的合成面部图像的唇形与第一合成音频的匹配度更高,提高了真人虚拟形象的合成效果。
-
公开(公告)号:CN109255830A
公开(公告)日:2019-01-22
申请号:CN201811011717.0
申请日:2018-08-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 彭哲
Abstract: 本申请实施例公开了三维人脸重建方法和装置。该方法的一具体实施方式包括:将获取的二维人脸图像输入已训练的人脸三维重建模型,得到与用于构建三维人脸模型的特征向量对应的特征系数,其中,特征向量基于对人脸三维重建模型的训练得出,基于特征向量和对应的特征系数构建二维人脸图像对应的三维人脸模型。该实施方式实现了用于构建三维人脸模型的特征向量的表达能力的提升,从而可以构建出更准确、更多样化的三维人脸模型。
-
公开(公告)号:CN111354370A
公开(公告)日:2020-06-30
申请号:CN202010091799.5
申请日:2020-02-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种唇形特征预测方法、装置和电子设备,涉及虚拟技术领域。具体实现方案为:识别语音特征的PPG;使用神经网络模型对所述PPG进行预测,以预测到语音特征的唇形特征,其中,所述神经网络模型为使用训练样本进行训练得到输入包括PPG,输出包括唇形特征的神经网络模型,所述训练样本包括PPG训练样本和唇形特征训练样本。本申请可以提高预测唇形特征的准确性。
-
-
-
-
-
-
-
-