用于生成图像的方法和装置

    公开(公告)号:CN110517214B

    公开(公告)日:2022-04-12

    申请号:CN201910799782.2

    申请日:2019-08-28

    Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取待处理人脸图像和目标人脸图像,其中,该待处理人脸图像中包括第一人脸图像和第一人脸图像的人脸关键点信息;将该人脸关键点信息输入至预设的人脸姿态估计模型,生成人脸姿态信息,其中,该人脸姿态估计模型用于表征人脸关键点信息与人脸姿态信息之间的对应关系;根据该人脸姿态信息,确定人脸图像融合系数;基于该人脸图像融合系数对该目标人脸图像和该第一人脸图像进行融合,生成第二人脸图像。该实施方式实现了针对人脸不同姿态对图像融合的方式进行调整,从而提升图像融合的效果。

    用于生成图像的方法和装置

    公开(公告)号:CN110516598B

    公开(公告)日:2022-03-01

    申请号:CN201910797619.2

    申请日:2019-08-27

    Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取底版图像和目标人脸图像,其中,该底版图像包括待替换人脸图像和背景;从与该待替换人脸图像匹配的预设人脸图像库中确定匹配人脸图像,其中,该匹配的预设人脸图像库中包括该待替换人脸图像所指示的人脸的不同面部姿态的人脸图像,该匹配人脸图像用于表征待替换人脸图像所显示的面部姿态与该目标人脸图像所显示的面部姿态一致;基于该匹配人脸图像对该待替换人脸图像的替换,生成目标图像,其中,该目标图像包括与该匹配人脸图像相一致的人脸图像和与该底版图像相一致的背景。该实施方式提升了生成与目标人脸图像的面部姿态相一致的图像的速度。

    多媒体数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN114051105A

    公开(公告)日:2022-02-15

    申请号:CN202111320124.4

    申请日:2021-11-09

    Abstract: 本公开提供了多媒体数据处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉等领域。具体实现方案为:根据参考视频数据中的参考音频数据,获得合成音频数据;将所述合成音频数据与所述参考音频数据进行映射,获得映射结果;根据所述映射结果,以及所述参考音频数据和所述参考视频数据的视频数据帧之间的映射关系,生成合成视频数据,所述合成视频数据中的音频数据为所述合成音频数据。本公开实施例能够为语音驱动人脸技术的使用和改进提供高度匹配的素材。

    皮肤图像处理方法、装置、电子设备和介质

    公开(公告)号:CN114004809A

    公开(公告)日:2022-02-01

    申请号:CN202111279502.9

    申请日:2021-10-29

    Abstract: 本公开提供了一种皮肤图像处理方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域。皮肤图像处理方法包括:对原始皮肤图像进行滤波处理,得到至少一个滤波后的图像;基于至少一个滤波后的图像,得到镜面反射图像,其中,镜面反射图像包括皮肤的表层信息;基于原始皮肤图像和镜面反射图像,得到漫反射图像,其中,漫反射图像包括皮肤的肌底层信息;处理漫反射图像,得到至少一个肌底层图像,其中,至少一个肌底层图像表征了皮肤肌底层的色素特征。

    文档分类的方法、装置、电子设备和存储介质

    公开(公告)号:CN113742483A

    公开(公告)日:2021-12-03

    申请号:CN202110994014.X

    申请日:2021-08-27

    Abstract: 本公开提供了一种文档分类的方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景下。具体实现方案为:一种文档分类的方法,包括:获取待处理文档包括的文本的文本信息和图像信息;基于所述文本信息和所述图像信息进行融合得到融合特征;根据所述融合特征获取所述文本的特征序列;基于预先定义的文档类别和所述特征序列,确定所述待处理文档的类别。本公开提供的技术方案解决了文档分类中的文档混淆的技术问题,提升了分类的精度。

    图像识别模型的训练方法、装置、设备以及介质

    公开(公告)号:CN112784751A

    公开(公告)日:2021-05-11

    申请号:CN202110090986.6

    申请日:2021-01-22

    Abstract: 本公开提供了一种图像识别模型的训练方法、装置、设备以及介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、图像处理技术领域,可应用于OCR场景。该图像识别模型的训练方法包括:获取训练数据,其中,训练数据包括针对预设垂类的训练图像,训练图像包括包含预设垂类的真实数据的第一训练图像和包含预设垂类的虚拟数据的第二训练图像;构建基础模型,其中,基础模型包括深度学习网络,深度学习网络配置为对训练图像进行识别,以提取训练图像中的文本数据;以及使用训练数据训练基础模型,以得到图像识别模型。

Patent Agency Ranking