基于布局关联性的视觉富文档信息抽取方法、系统及介质

    公开(公告)号:CN114782965B

    公开(公告)日:2025-04-04

    申请号:CN202210223134.4

    申请日:2022-03-07

    Abstract: 本发明公开了一种基于布局关联性的视觉富文档信息抽取方法、系统及介质,其中方法包括:获取视觉富文档图像,并对视觉富文档图像进行标注,获得数据集;构建针对布局关联性的文档信息抽取模型,采用数据集对文档信息抽取模型进行训练;获取视觉富文档图片,将视觉富文档图片输入训练后的文档信息抽取模型,获得信息抽取结果;其中,布局关联性指的是静态字段和动态字段之间的位置关系,静态字段为同一模板中文字固定的字段,动态字段为同一模板中根据实际内容变化的字段。本发明提供了一种利用文档布局关联性的视觉富文档信息抽取的方案,这种方案可在在小样本数据下即可实现高精度的视觉富文档信息抽取任务,可广泛应用于视觉信息抽取领域。

    基于布局关联性的视觉富文档信息抽取方法、系统及介质

    公开(公告)号:CN114782965A

    公开(公告)日:2022-07-22

    申请号:CN202210223134.4

    申请日:2022-03-07

    Abstract: 本发明公开了一种基于布局关联性的视觉富文档信息抽取方法、系统及介质,其中方法包括:获取视觉富文档图像,并对视觉富文档图像进行标注,获得数据集;构建针对布局关联性的文档信息抽取模型,采用数据集对文档信息抽取模型进行训练;获取视觉富文档图片,将视觉富文档图片输入训练后的文档信息抽取模型,获得信息抽取结果;其中,布局关联性指的是静态字段和动态字段之间的位置关系,静态字段为同一模板中文字固定的字段,动态字段为同一模板中根据实际内容变化的字段。本发明提供了一种利用文档布局关联性的视觉富文档信息抽取的方案,这种方案可在在小样本数据下即可实现高精度的视觉富文档信息抽取任务,可广泛应用于视觉信息抽取领域。

    一种针对实际OCR场景下的视觉富文档信息抽取方法

    公开(公告)号:CN112801010B

    公开(公告)日:2023-02-14

    申请号:CN202110168304.9

    申请日:2021-02-07

    Abstract: 本发明公开了一种针对实际OCR场景下的视觉富文档信息抽取方法,方法包括以下步骤:收集实际场景下的视觉富文本图像;利用预训练词嵌入模型抽取字符级别和单词级别的文本词嵌入特征和位置嵌入特征;训练命名实体分类模块;构建基于图卷积GAT的全局文档图结构,引入自注意力机制;训练命名实体边界定位模块;构建多特征聚合结构;训练错误语义纠正模块,采用GRU的解码结构,根据CRF的最优路径,取出对应维度特征的编码隐状态,通过将命名实体的类别信息,作为先验指导信息,指导每次解码器的输出,得到规范格式的实体命名信息。本发明有效提升了视觉富文档信息抽取方法在实际OCR检测识别应用中的精度,对视觉富文档信息的结构化存储具有重要的意义。

    一种针对实际OCR场景下的视觉富文档信息抽取方法

    公开(公告)号:CN112801010A

    公开(公告)日:2021-05-14

    申请号:CN202110168304.9

    申请日:2021-02-07

    Abstract: 本发明公开了一种针对实际OCR场景下的视觉富文档信息抽取方法,方法包括以下步骤:收集实际场景下的视觉富文本图像;利用预训练词嵌入模型抽取字符级别和单词级别的文本词嵌入特征和位置嵌入特征;训练命名实体分类模块;构建基于图卷积GAT的全局文档图结构,引入自注意力机制;训练命名实体边界定位模块;构建多特征聚合结构;训练错误语义纠正模块,采用GRU的解码结构,根据CRF的最优路径,取出对应维度特征的编码隐状态,通过将命名实体的类别信息,作为先验指导信息,指导每次解码器的输出,得到规范格式的实体命名信息。本发明有效提升了视觉富文档信息抽取方法在实际OCR检测识别应用中的精度,对视觉富文档信息的结构化存储具有重要的意义。

Patent Agency Ranking