图像矫正模型的训练方法、图像矫正方法、装置及介质

    公开(公告)号:CN116503686B

    公开(公告)日:2024-07-02

    申请号:CN202310318509.X

    申请日:2023-03-28

    Abstract: 本公开提供了图像矫正模型的训练方法、图像矫正方法、装置及介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域。具体实现方案为:将扭曲图输入图像矫正模型,得到图像矫正模型输出的偏移图;基于偏移图矫正扭曲图的前背景分割图,得到已矫正分割图;基于偏移图和标准偏移图之间的第一损失,以及已矫正分割图和标准分割图之间的第二损失,确定目标损失;基于目标损失调整图像矫正模型的参数。本公开实施例中,基于第一损失使得图像矫正模型输出的偏移图能够关心图像中心区域,基于第二损失使得偏移图能够适应复杂的背景和边缘的形变,由此训练得到的图像矫正模型,具有很好的泛化能力和鲁棒性。

    文档矫正模型的训练及图像矫正方法、装置、设备和介质

    公开(公告)号:CN116110054A

    公开(公告)日:2023-05-12

    申请号:CN202310116117.5

    申请日:2023-02-08

    Abstract: 本公开提供了一种文档矫正模型的训练及图像矫正方法、装置、设备和介质,涉及深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:采用文档矫正模型对样本文档图像进行矫正,以得到目标文档图像;对目标文档图像进行文本行检测,得到至少一个文本行的中心线;根据以下至少一项对文档矫正模型进行训练:目标文档图像中同一中心线上各像素点的图像坐标之间的差异、不同中心线上处于同一排列位置的像素点的图像坐标之间的差异。由此,可实现基于文本行中心线上的各像素点,约束模型矫正后的文档图像上的文本行的中心线方向与文档图像的阅读方向匹配,以提升文档图像的矫正效果,提升文档图像矫正还原的准确度。

    图像矫正方法及装置、电子设备和介质

    公开(公告)号:CN116416159A

    公开(公告)日:2023-07-11

    申请号:CN202310389889.6

    申请日:2023-04-12

    Abstract: 本公开提供了一种图像矫正方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于OCR、智慧政务等场景。实现方案为:获取待矫正图像;确定所述待矫正图像的形变图像特征,其中,所述形变图像特征指示所述待矫正图像发生的形变的类型和程度;对所述待矫正图像进行前背景分割,以得到所述待矫正图像的背景信息;根据所述形变图像特征和所述背景信息对所述待矫正图像进行后向预测,以得到所述待矫正图像的后向图;以及基于所述后向图对所述待矫正图像进行矫正。

    样本对生成、大模型的训练、图像检索方法及装置、设备和介质

    公开(公告)号:CN118643342A

    公开(公告)日:2024-09-13

    申请号:CN202410875590.6

    申请日:2024-07-01

    Inventor: 李星 谢群义 姚锟

    Abstract: 本公开提供了一种样本对生成、大模型的训练、图像检索方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于OCR等场景。该样本对生成方法包括:对图像样本进行处理,得到对象信息;根据提示词信息和对象信息,生成图像说明文本,其中,提示词信息包括系统提示信息和任务提示信息,图像说明文本用于描述图像样本的属性;以及,根据图像样本和图像说明文本,生成样本对。

    图像矫正模型的训练方法、图像矫正方法、装置及介质

    公开(公告)号:CN116503686A

    公开(公告)日:2023-07-28

    申请号:CN202310318509.X

    申请日:2023-03-28

    Abstract: 本公开提供了图像矫正模型的训练方法、图像矫正方法、装置及介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域。具体实现方案为:将扭曲图输入图像矫正模型,得到图像矫正模型输出的偏移图;基于偏移图矫正扭曲图的前背景分割图,得到已矫正分割图;基于偏移图和标准偏移图之间的第一损失,以及已矫正分割图和标准分割图之间的第二损失,确定目标损失;基于目标损失调整图像矫正模型的参数。本公开实施例中,基于第一损失使得图像矫正模型输出的偏移图能够关心图像中心区域,基于第二损失使得偏移图能够适应复杂的背景和边缘的形变,由此训练得到的图像矫正模型,具有很好的泛化能力和鲁棒性。

Patent Agency Ranking