基于视觉转换器的图像处理方法、训练方法和电子设备

    公开(公告)号:CN115761437A

    公开(公告)日:2023-03-07

    申请号:CN202211400729.9

    申请日:2022-11-09

    Abstract: 本公开提供了一种基于视觉转换器的图像处理方法、训练方法和电子设备,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。该方法包括:确定待处理图像的多个原图像标记;通过视觉转换器模型,将所述多个原图像标记拆分成至少两个重要图像标记和至少两个次要图像标记;通过所述视觉转换器模型,对所述至少两个重要图像标记进行聚合得到新的重要图像标记,并对所述至少两个次要图像标记进行聚合得到新的次要图像标记;通过所述视觉转换器模型,根据所述新的重要图像标记和所述新的次要图像标记进行图像处理,得到图像处理结果。通过上述技术方案能够提高图像处理的准确性。

    基于视觉转换器的图像处理方法、训练方法和电子设备

    公开(公告)号:CN115761437B

    公开(公告)日:2024-02-06

    申请号:CN202211400729.9

    申请日:2022-11-09

    Abstract: 本公开提供了一种基于视觉转换器的图像处理方法、训练方法和电子设备,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。该方法包括:确定待处理图像的多个原图像标记;通过视觉转换器模型,将所述多个原图像标记拆分成至少两个重要图像标记和至少两个次要图像标记;通过所述视觉转换器模型,对所述至少两个重要图像标记进行聚合得到新的重要图像标记,并对所述至少两个次要图像标记进行聚合得到新的次要图像标记;通过所述视觉转换器模型,根据所述新的重要图像标记和所述新的次要图像标记进行图像处理,得到图像处理结果。通过上述技术方案能够提高图像处理的准确性。

Patent Agency Ranking