结构化文档信息标注的方法、装置及电子设备

    公开(公告)号:CN111695518A

    公开(公告)日:2020-09-22

    申请号:CN202010538181.9

    申请日:2020-06-12

    Abstract: 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。

    图像处理方法、图像处理模型的训练方法和装置

    公开(公告)号:CN116597454B

    公开(公告)日:2024-07-12

    申请号:CN202310597526.1

    申请日:2023-05-24

    Abstract: 本公开提供了一种图像处理方法、图像处理模型的训练方法、装置和设备,涉及人工智能技术领域,具体为计算机视觉、图像处理、深度学习等技术领域,可应用于OCR、智慧政务等场景。图像处理方法包括:对目标图像进行文本识别,得到多个文本区域和其各自的文本内容;提取表征多个文本区域的视觉模态信息的多个第一视觉特征和每一个文本区域所包括的文本内容的文本模态信息的多个第一文本特征;基于多个第一视觉特征将多个第一文本特征融合,以得到多个第一文本融合特征;基于多个第一文本特征将多个第一视觉特征融合,以得到多个第一视觉融合特征;基于注意力机制对多个第一视觉融合特征和多个第一文本融合特征进行强化进而得到图像处理结果。

    文档图像的实体抽取方法、装置及存储介质

    公开(公告)号:CN116486420B

    公开(公告)日:2024-01-12

    申请号:CN202310389021.6

    申请日:2023-04-12

    Abstract: 本公开提供了一种文档图像的实体抽取方法及装置,涉及人工智能技术领域,具体涉及计算机视觉、OCR、深度学习等技术领域,可应用于智慧金融、智慧政务等场景。具体实现方案为:获取待分析文档图像,并获取待分析文档图像的多模态特征编码;将多模态特征编码输入至动态交互Transformer网络,生成语义表示融合特征;根据语义表示融合特征,得到待分析文档图像中每个文字对应的序列标记和实体标记;根据每个文字对应的序列标记和实体标记,得到待分析文档图像的实体抽取结果。本公开实施例的通过动态交互Transformer网络生成的语义表示融合特征(56)对比文件Wang Wenshan et al..Dynamicinteraction networks for image-textmultimodal learning《.Neurocomputing》.2020,第379卷262-272.李晓腾.面向社交媒体的命名实体识别方法研究《.中国优秀硕士学位论文全文数据库 (信息科技辑)》.2023,第I138-4297页.

    信息处理方法、装置、设备、介质和程序产品

    公开(公告)号:CN116152817B

    公开(公告)日:2024-01-02

    申请号:CN202211742761.5

    申请日:2022-12-30

    Abstract: 本公开提供了一种信息处理方法、装置、设备、介质和程序产品,涉及人工智能技术领域,具体为深度学习、图像处理和计算机视觉技术领域,可应用于OCR等场景。在本公开的一些实施例中,获取原始文本图像以及原始文本图像对应的原始文本;分别对原始文本和原始文本图像进行编码处理,得到文本特征和图像特征;将文本特征和图像特征输入至少一个特征交互神经网络层中,得到文本类别特征和图像类别特征;特征交互神经网络层用于对文本特征和图像特征中提取到的特征进行交叉合并处理,通过对神经网络结构进行优化,降低计算量;融合文本特征和图像特征,确定原始文本包含的实体的类型,提升实体类型识别的准确率。

    字段识别方法、装置、电子设备、存储介质和程序产品

    公开(公告)号:CN112966140B

    公开(公告)日:2023-08-08

    申请号:CN202110260014.7

    申请日:2021-03-10

    Abstract: 本公开公开了字段识别方法、装置、电子设备、存储介质和程序产品,涉及人工智能领域,具体为计算机视觉和深度学习技术,可应用于OCR场景下。具体实现方案为:预测图像数据包括的多个字段;提取每个字段的特征信息;基于所述多个字段的特征信息,构建所述多个字段的共同编码特征;基于多个查询向量对所述共同编码特征进行解码,得到所述多个查询向量对应的多个解码特征,任一所述查询向量关联目标字段和一个候选字段;从所述多个解码特征中确定目标解码特征,并将所述目标解码特征对应的查询向量所关联的候选字段确定所述目标字段的关联字段。本公开可以提高图像数据的字段识别效果。

    文本结构化信息确定方法、装置、设备及存储介质

    公开(公告)号:CN116524516A

    公开(公告)日:2023-08-01

    申请号:CN202310278136.8

    申请日:2023-03-20

    Abstract: 本公开提供了一种文本结构化信息确定方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:确定字段图像的视觉特征以及所述字段图像的初始文本识别结果;根据所述视觉特征和所述初始文本识别结果,对所述初始文本识别结果进行矫正,得到矫正文本识别结果;根据所述字段图像对应的字段类别和所述矫正文本识别结果,确定所述字段图像的文本结构化信息。通过上述技术方案,能够提高确定文本结构化信息的准确率。

    表单识别方法、装置及电子设备

    公开(公告)号:CN114724156B

    公开(公告)日:2023-07-25

    申请号:CN202210419150.0

    申请日:2022-04-20

    Abstract: 本公开提供了一种表单识别方法、装置及电子设备,涉及人工智能技术领域,具体涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:获取待识别图像,所述待识别图像包括目标表单的图像内容,所述目标表单包括M个文本实体单元;基于所述待识别图像获取所述目标表单的第一特征;基于所述第一特征,对所述M个文本实体单元进行实体分类,得到每个文本实体单元的实体类别;基于所述第一特征,对所述M个文本实体单元中不同文本实体单元之间的关联关系进行预测,得到所述M个文本实体单元的关系信息,所述关联关系用于表征不同文本实体单元之间是否存在关联;基于所述实体类别和所述关系信息,输出所述目标表单的表单信息。

Patent Agency Ranking