一种双流场景文本图像分割方法、装置及存储介质

    公开(公告)号:CN116434236A

    公开(公告)日:2023-07-14

    申请号:CN202310286891.0

    申请日:2023-03-21

    Abstract: 本发明公开了一种双流场景文本图像分割方法、装置及存储介质,其中方法包括:获取场景文本图像以及对应的二值化图像进行分割标注,获得输入图像;构建双流文本分割网络,提取输入图像的全局注意力特征和局部细节特征,并将提取的两种特征融合为文本分割特征;采用文本语义信息来引导双流文本分割网络关注文本所在区域,以增强文本分割特征;将经过增强的文本分割特征动态地上采样,得到输出二值化分割图像;计算输出二值化分割图像和标注的二值化图像之间的损失,根据计算的损失训练整个神经网络。本发明能够解决场景文本在图片中分布不均和尺度、形状变化多样的问题,提高文本图像分割性能,可广泛应用于模式识别与人工智能技术领域。

    自然场景文本图像字符像素弱监督自动标注方法、系统及介质

    公开(公告)号:CN113673338B

    公开(公告)日:2023-09-26

    申请号:CN202110806669.X

    申请日:2021-07-16

    Abstract: 本发明公开了一种自然场景文本图像字符像素弱监督自动标注方法、系统及介质,该方法包括收集训练样本;生成合成数据;构建并利用训练样本及合成数据训练弱监督实例分割模型;生成伪标注;利用带伪标注数据继续训练;利用已完成训练的弱监督实例分割模型对待标注自然场景文本行图像进行像素级自动标注。本发明能够利用仅带有文本行字符串内容标注的自然场景文本行图像,自动而准确地生成其中每个字符的字符像素标注,从而能够大大解放人力,并可以辅助提升文本行识别器的性能及为场景文本编辑、擦除模型提供细粒度标注信息。此外,本发明鲁棒性强,能够完成各种真实场景环境下复杂结构中英文字符的自动标注。

    一种表格数据增强方法、表格识别方法、装置及存储介质

    公开(公告)号:CN115359501A

    公开(公告)日:2022-11-18

    申请号:CN202210900596.5

    申请日:2022-07-28

    Abstract: 本发明公开了一种表格数据增强方法、表格识别方法、装置及存储介质,其中表格数据增强方法包括:获取表格图片数据,对表格图片数据进行标注,获得标注信息;根据所述标注信息计算并生成表格的行标识矩阵和列标识矩阵;根据生成的标识矩阵获取表格的可切割位置,根据可切割位置对表格图片进行切割;将切割出来的每个表格图片的特征进行更正,获得增强的表格图片数据。本发明可以从一张表格上获取多个表格数据,不会破坏表格本身的结构,实现高质量的数据增强,对于现存的稀缺但又难以扩充的表格数据具有重大的意义;且适用于各种类型的表格,尤其是具有跨行跨列单元格的复杂表格。本发明可广泛应用于计算机视觉领域和表格识别领域。

    自然场景文本图像字符像素弱监督自动标注方法、系统及介质

    公开(公告)号:CN113673338A

    公开(公告)日:2021-11-19

    申请号:CN202110806669.X

    申请日:2021-07-16

    Abstract: 本发明公开了一种自然场景文本图像字符像素弱监督自动标注方法、系统及介质,该方法包括收集训练样本;生成合成数据;构建并利用训练样本及合成数据训练弱监督实例分割模型;生成伪标注;利用带伪标注数据继续训练;利用已完成训练的弱监督实例分割模型对待标注自然场景文本行图像进行像素级自动标注。本发明能够利用仅带有文本行字符串内容标注的自然场景文本行图像,自动而准确地生成其中每个字符的字符像素标注,从而能够大大解放人力,并可以辅助提升文本行识别器的性能及为场景文本编辑、擦除模型提供细粒度标注信息。此外,本发明鲁棒性强,能够完成各种真实场景环境下复杂结构中英文字符的自动标注。

Patent Agency Ranking