一种文档图像几何校正方法、系统、装置及介质

    公开(公告)号:CN114418869A

    公开(公告)日:2022-04-29

    申请号:CN202111584077.4

    申请日:2021-12-22

    Abstract: 本发明公开了一种文档图像几何校正方法、系统、装置及介质,其中方法包括:获取第一文档图像,对第一文档图像中的像素进行分类,区分文档图像中前景文档区域和环境边界区域,获取前景文档区域的掩膜图;在掩模图上提取控制点,根据控制点对第一文档图像进行初步矫正,删除环境边界,获得初步矫正并删除环境边界的第二文档图像;获取第二文档图像的第一坐标偏移矩阵,根据第一坐标偏移矩阵对第二文档图像进行偏移后,获得矫正后的第三文档图像。本发明能够处理具有不同环境边界区域的拍摄文档图像,包括具有较小的环境边界区域、具有较大的环境边界区域或者不具有环境边界区域的情况。本发明可广泛应用于模式识别与人工智能技术领域。

    一种基于多尺度特征的场景文本识别方法

    公开(公告)号:CN111967471A

    公开(公告)日:2020-11-20

    申请号:CN202010841752.6

    申请日:2020-08-20

    Abstract: 本发明公开一种基于多尺度特征的场景文本识别方法,包括:获取场景文本图像数据集,并对场景文本图像数据集中的图像数据进行尺寸调整;构建文本识别模型,并利用尺寸调整后的场景文本图像数据集对文本识别模型进行训练;文本识别模型包括多尺度特征编码模块、多层注意力机制解码模块;多尺度特征编码模块用于获取若干个尺度的字符特征,多层注意力机制解码模块联合二维注意力机制和一维注意力机制对若干个尺度的字符特征进行融合,得到场景文本中的字符识别结果;采集待识别场景文本图像,将场景文本图像调整到统一尺寸后输入训练好的文本识别模型,完成场景文本中多尺度字符的识别。本发明能够对场景文本中的多尺度字符进行快速准确识别。

    一种文档图像几何校正方法、系统、装置及介质

    公开(公告)号:CN114418869B

    公开(公告)日:2024-08-13

    申请号:CN202111584077.4

    申请日:2021-12-22

    Abstract: 本发明公开了一种文档图像几何校正方法、系统、装置及介质,其中方法包括:获取第一文档图像,对第一文档图像中的像素进行分类,区分文档图像中前景文档区域和环境边界区域,获取前景文档区域的掩膜图;在掩模图上提取控制点,根据控制点对第一文档图像进行初步矫正,删除环境边界,获得初步矫正并删除环境边界的第二文档图像;获取第二文档图像的第一坐标偏移矩阵,根据第一坐标偏移矩阵对第二文档图像进行偏移后,获得矫正后的第三文档图像。本发明能够处理具有不同环境边界区域的拍摄文档图像,包括具有较小的环境边界区域、具有较大的环境边界区域或者不具有环境边界区域的情况。本发明可广泛应用于模式识别与人工智能技术领域。

    一种扫描文档矫正方法、系统、装置和存储介质

    公开(公告)号:CN116453128A

    公开(公告)日:2023-07-18

    申请号:CN202310239525.X

    申请日:2023-03-13

    Abstract: 本发明公开了一种扫描文档矫正方法、系统、装置和存储介质,其中方法包括:获取文档图像,对所述文档图像进行分割处理,获得分割掩膜图;对所述分割掩膜图进行边界线段检测,获得多条边界线段;对所述边界线段进行识别,以获得所述边界线段的类型;根据识别后的所述边界线段,为文档的四个边界分别选取一条特征线段;根据所述特征线段进行仿射变换矫正,获得矫正后的文档图像。本发明通过对线段进行处理,可以处理多种边界、角点缺失的情况,也可以处理角点处含有折叠的文档,具有较好的适用性;另外,本发明仅利用仿射变换进行矫正,不会引入额外的形变。本发明可广泛应用于文档图像处理技术领域。

    一种适用于一类光色可调OLED的调光装置

    公开(公告)号:CN110113839A

    公开(公告)日:2019-08-09

    申请号:CN201910399942.4

    申请日:2019-05-14

    Abstract: 本发明公开了一种适用于一类光色可调OLED的调光装置,包括:主电路板;电源输入模块,与所述主电路板电路连接,用于提供直流电源;电源开关,用于控制所述电源输入模块的通断;亮度调节模块,连接所述主电路板,用于通过同时改变驱动电压/电流的幅值和占空比调节OLED发光器件的颜色;颜色调节模块,连接所述主电路板,用于通过单独调节直流驱动电压/电流的幅值调节OLED发光器件的颜色;输出模块,按照正负极接入OLED发光器件。本发明结合脉冲幅度调制(PAM)和脉冲宽度调制(PWM),将调节直流驱动电压/电流的幅值和占空比转化为直接调节OLED器件的发光颜色和亮度,实现对发光颜色和亮度的单独调节。

    一种适用于拍照文档的图像配准方法、系统、装置及介质

    公开(公告)号:CN116468759A

    公开(公告)日:2023-07-21

    申请号:CN202310258553.6

    申请日:2023-03-16

    Abstract: 本发明公开了一种适用于拍照文档的图像配准方法、系统、装置及介质,其中方法包括:获取拍照文档图像,对所述拍照文档图像进行非刚性预对齐,获得预对齐文档图像;获取干净文档图像,对所述干净文档图像和预对齐文档图像进行分层对齐,获得多尺度特征图和偏移场;对所述多尺度特征图和偏移场进行细粒度循环细化,获得与所述预对齐文档图像相同尺度大小的偏移场。本发明能够处理具有不同干扰因素的拍照文档图像,包括纸张扭曲、纸张褶皱、拍摄光照变化或者阴影变化的情况。本发明可广泛应用于模式识别与人工智能技术领域。

    一种表格数据增强方法、表格识别方法、装置及存储介质

    公开(公告)号:CN115359501A

    公开(公告)日:2022-11-18

    申请号:CN202210900596.5

    申请日:2022-07-28

    Abstract: 本发明公开了一种表格数据增强方法、表格识别方法、装置及存储介质,其中表格数据增强方法包括:获取表格图片数据,对表格图片数据进行标注,获得标注信息;根据所述标注信息计算并生成表格的行标识矩阵和列标识矩阵;根据生成的标识矩阵获取表格的可切割位置,根据可切割位置对表格图片进行切割;将切割出来的每个表格图片的特征进行更正,获得增强的表格图片数据。本发明可以从一张表格上获取多个表格数据,不会破坏表格本身的结构,实现高质量的数据增强,对于现存的稀缺但又难以扩充的表格数据具有重大的意义;且适用于各种类型的表格,尤其是具有跨行跨列单元格的复杂表格。本发明可广泛应用于计算机视觉领域和表格识别领域。

    一种文档图像增强统一方法及系统

    公开(公告)号:CN118314048B

    公开(公告)日:2025-02-14

    申请号:CN202410453865.7

    申请日:2024-04-16

    Abstract: 本发明公开了一种文档图像增强统一方法及系统,其中方法包括以下步骤:基于待增强文档图像以及待执行的特定的增强任务进行二维视觉提示提取;利用提取到的二维视觉提示指导共享参数的深度神经网络对待增强文档图像执行特定的增强任务。本发明创新性地提出用底层视觉特征作为视觉提示指导模型执行不同的增强任务,在提升增强性能的同时实现仅用一个模型,训练一次,完成多种文档图像增强任务。

Patent Agency Ranking