-
公开(公告)号:CN113379594B
公开(公告)日:2024-11-15
申请号:CN202110728844.8
申请日:2021-06-29
Applicant: 北京百度网讯科技有限公司
IPC: G06T3/04 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了脸型变换模型训练、脸型变换方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及计算机视觉和深度学习等人工智能技术领域,可应用于人脸图像处理等场景。该方法包括:基于第一脸型特征集和第二脸型特征集,得到第一生成网络和第二生成网络;分别利用第一生成网络和第二生成网络生成与第一样本图像对应的第一目标图像和与第二样本图像对应的第二目标图像;分别利用第二生成网络和第一生成网络生成与第一目标图像对应的第一变换图像、与第二目标图像对应的第二变换图像;控制第一样本图像与第一变换图像、第二样本图像与第二变换图像被判别为相同的图像;将满足要求的生成对抗网络输出为目标脸型变换模型。
-
公开(公告)号:CN115147845A
公开(公告)日:2022-10-04
申请号:CN202210764183.9
申请日:2022-06-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/148 , G06V30/19 , G06V10/26 , G06V10/774 , G06V10/82
Abstract: 本公开提供一种字符分割方法、字符分割模型的训练方法及相关设备,涉及计算机技术领域,具体涉及图像识别、图像分割、字符识别、汉字分割等技术领域,可应用于汉字识别、汉字分割、字符识别、字符分割等场景。具体实现方案包括:获取原始图像;获取第一字符对应的标注图像;通过将原始图像和标注图像输入到字符分割模型,根据第一参考标注信息获取原始图像每个像素点的第一分割标注信息。本公开可以对第一字符进行快速、准确地分割。
-
公开(公告)号:CN114820867A
公开(公告)日:2022-07-29
申请号:CN202210430159.1
申请日:2022-04-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种字形生成方法、字形生成模型的训练方法及装置,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。实现方案为:获取源字形图像和所述源字形图像对应的参考字形图像集,所述源字形图像包括源字体的源字符,所述参考字形图像集包括目标字体的至少一个参考字符;将所述源字形图像与所述参考字形图像集进行融合,以得到所述源字符的中间字形图像;以及将所述中间字形图像与所述参考字形图像集进行融合,以得到所述源字符的生成字形图像,所述生成字形图像包括所述目标字体的所述源字符。
-
公开(公告)号:CN114820867B
公开(公告)日:2022-12-13
申请号:CN202210430159.1
申请日:2022-04-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种字形生成方法、字形生成模型的训练方法及装置,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。实现方案为:获取源字形图像和所述源字形图像对应的参考字形图像集,所述源字形图像包括源字体的源字符,所述参考字形图像集包括目标字体的至少一个参考字符;将所述源字形图像与所述参考字形图像集进行融合,以得到所述源字符的中间字形图像;以及将所述中间字形图像与所述参考字形图像集进行融合,以得到所述源字符的生成字形图像,所述生成字形图像包括所述目标字体的所述源字符。
-
公开(公告)号:CN114973279A
公开(公告)日:2022-08-30
申请号:CN202210688816.2
申请日:2022-06-17
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/228 , G06V30/32 , G06V30/19
Abstract: 本公开提供了一种手写文本图像生成模型的训练方法、装置和存储介质,涉及人工智能技术领域,具体涉及计算机视觉、图像处理、深度学习等技术领域。具体实现方案为:在将样本内容图像以及第二样本手写文本图像输入到训练模型中的初始手写文本图像生成模型得到第一预测手写文本图像,并将样本图像内容以及第一样本手写文本图像输入到训练模型中的初始手写文本图像重构模型中得到第二测手写文本图像,以及根据第一预测手写文本图像、第二预测手写文本图像和第一样本手写文本图像对训练模型进行训练,并将训练好的训练模型中的手写文本图像生成模型作为目标手写文本图像生成模型。由此,提高训练模型的收敛速度,提高手写文本图像生成模型的训练效率。
-
公开(公告)号:CN114913533A
公开(公告)日:2022-08-16
申请号:CN202210513585.1
申请日:2022-05-11
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V10/774
Abstract: 本公开提供了字重的变化方法和装置,人工智能技术领域,具体涉及深度学习、图像处理和计算机视觉技术领域,可应用于OCR等场景。具体实施方式包括:获取包含字的待变化图像;获取目标字重值;将待变化图像和目标字重值输入字重变化模型,得到从字重变化模型输出的输出图像,其中,输出图像包含目标字重值的字,待变化图像包含的字和输出图像包含的字之间的字重值不同,字重变化模型是深度神经网络。本公开可以通过深度神经网络,实现字重的变化,准确地获取到目标字重值的字。
-
公开(公告)号:CN114820871A
公开(公告)日:2022-07-29
申请号:CN202210748173.6
申请日:2022-06-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种字体生成方法、字体生成模型的训练方法、装置、设备和介质,涉及深度学习、图像处理、计算机视觉等技术领域。方案为:分别对待处理图像和参考图像进行编码,以得到待处理图像中第一待处理字符的内容特征及参考图像中参考字符的风格特征;将内容特征和风格特征进行融合,得到目标特征;对目标特征进行解码,得到包括具有参考风格的第二待处理字符的预测图像。由此,可实现将参考图像中具有参考风格的各字符的风格特征,融合进待处理图像中各字符的内容特征中,从而可使解码后的预测图像中各字符具有参考图像中的参考风格,提升预测图像中各字符的生成效果或字体风格的迁移效果,即提升预测图像生成结果的准确性。
-
公开(公告)号:CN113536991B
公开(公告)日:2023-06-23
申请号:CN202110730128.3
申请日:2021-06-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/088
Abstract: 本公开公开一种训练集生成、人脸图像处理方法、装置及电子设备,涉及领域人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于人脸图像处理等场景。具体实现方案为:通过图像美学算法确定人脸图像数据集中每张人脸图像的美感得分;通过人脸质量评价算法确定人脸图像数据集中每张人脸图像的人脸质量得分;通过图像质量评估算法确定人脸图像数据集中每张人脸图像的自适应质量得分;确定每张人脸图像的综合得分;选取预设数量的人脸图像,以生成用于训练人脸属性编辑模型的训练集。可以生成高质量的训练集,提高人脸属性编辑模型编辑的人脸图像的美观度与自然度。
-
公开(公告)号:CN114973279B
公开(公告)日:2023-02-17
申请号:CN202210688816.2
申请日:2022-06-17
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/228 , G06V30/32 , G06V30/19
Abstract: 本公开提供了一种手写文本图像生成模型的训练方法、装置和存储介质,涉及人工智能技术领域,具体涉及计算机视觉、图像处理、深度学习等技术领域。具体实现方案为:在将样本内容图像以及第二样本手写文本图像输入到训练模型中的初始手写文本图像生成模型得到第一预测手写文本图像,并将样本图像内容以及第一样本手写文本图像输入到训练模型中的初始手写文本图像重构模型中得到第二测手写文本图像,以及根据第一预测手写文本图像、第二预测手写文本图像和第一样本手写文本图像对训练模型进行训练,并将训练好的训练模型中的手写文本图像生成模型作为目标手写文本图像生成模型。由此,提高训练模型的收敛速度,提高手写文本图像生成模型的训练效率。
-
公开(公告)号:CN115147850A
公开(公告)日:2022-10-04
申请号:CN202210777263.8
申请日:2022-06-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V30/148 , G06V10/26 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开提供了文字生成模型的训练方法、文字生成方法及其装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,该方法包括:获取多个训练文字对,其中,任一训练文字对中包括第一字体下的样本文字,和样本文字对应的第二字体下的参考文字;对样本文字进行分割,获取样本文字的N个组成元素;根据样本文字和N个组成元素获取融合特征表示,以及获取参考文字的第一特征表示;基于融合特征表示和第一特征表示对文字生成模型进行训练,以获取目标文字生成模型。本申请实施例可以捕捉字体中的部首信息进行学习,可以实现文字生成效果的优化,提高生成字体的效率的同时,也提高了字体生成的准确率。
-
-
-
-
-
-
-
-
-