-
公开(公告)号:CN113313114B
公开(公告)日:2023-06-30
申请号:CN202110652178.4
申请日:2021-06-11
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了证件信息获取方法、装置、设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域。具体实现方案为:获取目标证件图像;对目标证件图像进行文本识别,确定文本识别结果;响应于确定文本识别结果中包括字符,对文本识别结果中的字符进行再次识别,得到字符优化结果;根据字符优化结果,更新文本识别结果;输出更新后的文本识别结果。本实现方式能够对字符的识别结果进行优化,提高文本识别的准确度。
-
公开(公告)号:CN111914628B
公开(公告)日:2023-06-20
申请号:CN202010564107.4
申请日:2020-06-19
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V40/16
Abstract: 本申请公开了一种人脸识别模型的训练方法和装置,涉及人工智能、深度学习及计算机视觉技术领域,具体涉及人脸识别技术领域。具体实现方案为:获取第一训练图像,第一训练图像为未遮挡人脸图像,并获取多个遮挡物图像后,将多个遮挡物图像分别融合至未遮挡人脸图像,以生成多个第二训练图像,将第一训练图像和第二训练图像输入人脸识别模型,以对人脸识别模型进行训练。由此,采用未遮挡人脸图像和融合得到的多个第二训练图像对人脸识别模型进行训练,使得训练后的人脸识别模型能够同时准确识别出未遮挡人脸图像和遮挡人脸图像,解决了现有的人脸识别模型对存在遮挡物的人脸图像识别时精确率较低,甚至无法识别存在遮挡物的人脸图像的技术问题。
-
公开(公告)号:CN115359166B
公开(公告)日:2023-03-24
申请号:CN202211283618.4
申请日:2022-10-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图像生成方法、装置、电子设备和介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。具体实现方案为:确定目标人物形象在目标图像中的第一面部特征,并根据第一面部特征生成目标人物形象的第一面部轮廓图像;确定样本人物形象在样本图像中的第二面部特征,并根据第二面部特征生成样本人物形象的第二面部轮廓图像;根据目标图像、第一面部轮廓图像和第二面部轮廓图像,生成包含目标人物形象的待展示图像。本公开能够提高根据样本图像生成包含目标人物形象的待展示图像的速度,减少了待展示图像生成所消耗的时间。
-
公开(公告)号:CN112949415B
公开(公告)日:2023-03-24
申请号:CN202110156565.9
申请日:2021-02-04
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/413 , G06V30/146 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本公开公开了一种图像处理方法、装置、设备和介质,涉及人工智能技术领域,具体涉及计算机视觉、深度学习等技术领域。该图像处理方法包括:获取图像中至少一个文本区域的各个文本区域的多模态特征,所述多模态特征包括多个维度的特征;对所述各个文本区域的多模态特征进行全局注意力处理,以得到所述各个文本区域的全局注意力特征;基于所述各个文本区域的全局注意力特征,确定所述各个文本区域的类别,基于所述各个文本区域的文本内容和所述类别构建结构化信息。本公开可以提供更具有普适性的图像中的结构化信息的构建方案。
-
公开(公告)号:CN115018992B
公开(公告)日:2023-03-17
申请号:CN202210760912.3
申请日:2022-06-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种发型模型的生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为增强现实AR、虚拟现实VR、计算机视觉、增强现实、深度学习等技术领域,可应用于虚拟形象、元宇宙等场景。该方法包括:根据目标对象的头部图像进行发丝模型建模,得到初始发丝模型;根据所述初始发丝模型中的发丝顶点,生成发型网格模型;对所述发型网格模型中的表面进行优化,得到目标对象的发型模型。通过上述技术方案能够提高发型渲染效率。
-
公开(公告)号:CN113657398B
公开(公告)日:2023-02-07
申请号:CN202110947890.7
申请日:2021-08-18
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/148 , G06V30/19
Abstract: 本公开提供了图像识别方法和装置,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,具体可用于OCR光学字符识别等场景。具体实现方案为:获取待识别图像;将待识别图像输入预设的图像识别模型,得到与至少两个卡证图像中每一卡证图像对应的第一识别结果;根据第一识别结果所指示的类别,对与第一识别结果对应的卡证图像执行相应的识别操作,得到第二识别结果;汇总第二识别结果并输出。该方式有效提高了对多卡证图像进行识别的准确率和效率。
-
公开(公告)号:CN115690238A
公开(公告)日:2023-02-03
申请号:CN202211259334.1
申请日:2022-10-14
Applicant: 北京百度网讯科技有限公司
IPC: G06T9/00 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本公开提供了一种图像生成及模型训练方法、装置、设备和存储介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。图像生成方法包括:对第一图像的唇部区域进行掩码处理,以获取第二图像;对所述第一图像进行编码处理,以获取第一图像特征;对所述第二图像进行编码处理,以获取第二图像特征;对语音进行编码处理,以获取语音特征;基于所述第一图像特征、所述第二图像特征和所述语音特征,获取融合特征;对所述融合特征进行解码处理,以生成目标图像,所述目标图像是所述语音驱动所述第一图像的唇部区域后得到的图像。本公开可以提高图像质量。
-
公开(公告)号:CN115375823B
公开(公告)日:2023-01-31
申请号:CN202211290183.6
申请日:2022-10-21
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种三维虚拟服饰生成方法、装置、设备及存储介质,涉及人工智能技术领域,尤其涉及增强现实、虚拟现实、计算机视觉和深度学习等技术领域。具体实现方案为:获取服饰图像;根据服饰图像和与服饰图像相关的服饰先验信息,进行三维模型拟合重建,生成目标服饰模型;根据服饰图像对目标服饰模型进行纹理渲染,生成与服饰图像对应的三维虚拟服饰。从而,基于单张图像即可实现三维虚拟服饰的高精度重建,提高了三维虚拟服饰的重建质量。
-
公开(公告)号:CN115359166A
公开(公告)日:2022-11-18
申请号:CN202211283618.4
申请日:2022-10-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图像生成方法、装置、电子设备和介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于元宇宙、虚拟数字人等场景。具体实现方案为:确定目标人物形象在目标图像中的第一面部特征,并根据第一面部特征生成目标人物形象的第一面部轮廓图像;确定样本人物形象在样本图像中的第二面部特征,并根据第二面部特征生成样本人物形象的第二面部轮廓图像;根据目标图像、第一面部轮廓图像和第二面部轮廓图像,生成包含目标人物形象的待展示图像。本公开能够提高根据样本图像生成包含目标人物形象的待展示图像的速度,减少了待展示图像生成所消耗的时间。
-
公开(公告)号:CN114842122B
公开(公告)日:2022-11-04
申请号:CN202210763645.5
申请日:2022-07-01
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种模型渲染方法、装置、设备及存储介质,涉及人工智能技术领域,尤其涉及增强现实、虚拟现实、计算机视觉和深度学习等技术领域,可应用于元宇宙等场景。具体实现方案为:根据对虚拟对象的控制操作,确定所述虚拟对象在虚拟空间的空间位置信息;根据所述空间位置信息,从所述虚拟对象的第一候选减面模型中选择目标减面模型;其中,所述第一候选减面模型为对所述虚拟对象的目标高精模型进行不同面数的减面处理得到;对所述目标减面模型进行渲染。通过上述技术方案,能够实现在不影响视觉效果的情况下,高效完成移动端上模型的渲染操作。
-
-
-
-
-
-
-
-
-