文本结构化信息确定方法、装置、设备及存储介质

    公开(公告)号:CN116524516A

    公开(公告)日:2023-08-01

    申请号:CN202310278136.8

    申请日:2023-03-20

    Abstract: 本公开提供了一种文本结构化信息确定方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:确定字段图像的视觉特征以及所述字段图像的初始文本识别结果;根据所述视觉特征和所述初始文本识别结果,对所述初始文本识别结果进行矫正,得到矫正文本识别结果;根据所述字段图像对应的字段类别和所述矫正文本识别结果,确定所述字段图像的文本结构化信息。通过上述技术方案,能够提高确定文本结构化信息的准确率。

    文本关系检测、模型的训练方法、装置、设备及介质

    公开(公告)号:CN116152819A

    公开(公告)日:2023-05-23

    申请号:CN202310142310.6

    申请日:2023-02-09

    Abstract: 本公开提供了一种文本关系检测、模型的训练方法、装置、设备及介质,涉及人工智能领域,具体涉及深度学习和图像处理领域等。具体实现方案为:对文本图像进行特征提取,得到文本特征;根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别;采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系。本公开实施例可以提高文本关系检测准确性。

    信息生成方法、信息处理方法、装置、电子设备以及介质

    公开(公告)号:CN116311298A

    公开(公告)日:2023-06-23

    申请号:CN202310023539.8

    申请日:2023-01-06

    Abstract: 本公开提供了一种信息生成方法、信息处理方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及深度学习技术、图像处理技术和计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到检测信息,检测信息包括多个文本区域各自的类别信息和位置信息;根据位置信息和文本图像,获取与多个文本区域各自对应的文本区域图像;对文本区域图像进行文本识别,得到识别信息,识别信息包括多个文本区域图像各自的文本识别信息;根据识别信息,确定语义关系信息,语义关系信息包括多个文本识别信息之间的语义关系;根据类别信息、语义关系信息和识别信息,生成文本图像的结构化信息。

    信息生成方法、信息处理方法、装置、电子设备以及介质

    公开(公告)号:CN115984888A

    公开(公告)日:2023-04-18

    申请号:CN202310023575.4

    申请日:2023-01-06

    Abstract: 本公开提供了一种信息生成方法、信息处理方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及深度学习技术、图像处理技术和计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到检测信息,其中,检测信息包括第一检测信息和第二检测信息,第一检测信息包括多个第一文本区域各自的类别信息和第一位置信息,第二检测信息包括至少一个第二文本区域各自的第二位置信息;根据第一位置信息和文本图像,获取与多个第一文本区域各自对应的文本区域图像;对文本区域图像进行文本识别,得到识别信息;根据类别信息、第二检测信息和识别信息,生成文本图像的结构化信息。

    图像识别方法装置、设备和存储介质

    公开(公告)号:CN114299522B

    公开(公告)日:2023-08-29

    申请号:CN202210023327.5

    申请日:2022-01-10

    Abstract: 本公开提供了一种图像识别方法装置、设备和存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:基于待识别图像的特征图,得到多个键实例特征和多个值实例特征;将所述多个键实例特征和所述多个值实例特征进行匹配,得到多个实例特征组合;对所述多个实例特征组合中的每个实例特征组合中的键实例特征和值实例特征进行融合,得到所述每个实例特征组合所对应的融合特征;基于与所述多个实例特征组合分别对应的多个融合特征,得到所述待识别图像的多个键值识别结果。根据本公开的技术,可以充分利用图像中键实例丰富的语义信息,帮助值实例实现更好的分类解析,输出更加准确的图像识别结果。

    表格解析方法及装置
    6.
    发明公开

    公开(公告)号:CN114842489A

    公开(公告)日:2022-08-02

    申请号:CN202210521847.9

    申请日:2022-05-13

    Abstract: 本公开提供了一种表格解析方法、装置、设备、存储介质以及计算机程序产品,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:获取待解析的表格图像;对表格图像进行特征提取,得到多个字段特征;对多个字段特征进行行列分类,得到每个字段特征的行列属性;基于行列属性,对多个字段特征对应的文本进行排列,得到解析后的文本表格。提高了表格解析的准确性。

    文本结构化处理方法、处理装置、电子设备以及存储介质

    公开(公告)号:CN113627439A

    公开(公告)日:2021-11-09

    申请号:CN202110921811.5

    申请日:2021-08-11

    Abstract: 本公开提供了一种文本结构化处理方法、处理装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到与文本图像对应的至少一个文本检测框的类别信息,其中,类别信息包括关键字类别或数值类别;确定与至少一个文本检测框中的目标文本检测框对应的文本图像;对与目标文本检测框对应的文本图像进行文本识别,得到与目标文本检测框对应的文本图像的文本识别结果;对文本识别结果进行文本分类,得到与文本识别结果对应的语义类别结果;生成文本结构化结果,其中,文本结构化结果包括与关键字类别对应的值和与数值类别对应的值。

Patent Agency Ranking