-
公开(公告)号:CN116524516A
公开(公告)日:2023-08-01
申请号:CN202310278136.8
申请日:2023-03-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本结构化信息确定方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:确定字段图像的视觉特征以及所述字段图像的初始文本识别结果;根据所述视觉特征和所述初始文本识别结果,对所述初始文本识别结果进行矫正,得到矫正文本识别结果;根据所述字段图像对应的字段类别和所述矫正文本识别结果,确定所述字段图像的文本结构化信息。通过上述技术方案,能够提高确定文本结构化信息的准确率。
-
公开(公告)号:CN116152819A
公开(公告)日:2023-05-23
申请号:CN202310142310.6
申请日:2023-02-09
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本关系检测、模型的训练方法、装置、设备及介质,涉及人工智能领域,具体涉及深度学习和图像处理领域等。具体实现方案为:对文本图像进行特征提取,得到文本特征;根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别;采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系。本公开实施例可以提高文本关系检测准确性。
-
公开(公告)号:CN116311298A
公开(公告)日:2023-06-23
申请号:CN202310023539.8
申请日:2023-01-06
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/412 , G06V30/19
Abstract: 本公开提供了一种信息生成方法、信息处理方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及深度学习技术、图像处理技术和计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到检测信息,检测信息包括多个文本区域各自的类别信息和位置信息;根据位置信息和文本图像,获取与多个文本区域各自对应的文本区域图像;对文本区域图像进行文本识别,得到识别信息,识别信息包括多个文本区域图像各自的文本识别信息;根据识别信息,确定语义关系信息,语义关系信息包括多个文本识别信息之间的语义关系;根据类别信息、语义关系信息和识别信息,生成文本图像的结构化信息。
-
公开(公告)号:CN115984888A
公开(公告)日:2023-04-18
申请号:CN202310023575.4
申请日:2023-01-06
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/414 , G06V30/19 , G06V30/148 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种信息生成方法、信息处理方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及深度学习技术、图像处理技术和计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到检测信息,其中,检测信息包括第一检测信息和第二检测信息,第一检测信息包括多个第一文本区域各自的类别信息和第一位置信息,第二检测信息包括至少一个第二文本区域各自的第二位置信息;根据第一位置信息和文本图像,获取与多个第一文本区域各自对应的文本区域图像;对文本区域图像进行文本识别,得到识别信息;根据类别信息、第二检测信息和识别信息,生成文本图像的结构化信息。
-
公开(公告)号:CN114299522B
公开(公告)日:2023-08-29
申请号:CN202210023327.5
申请日:2022-01-10
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图像识别方法装置、设备和存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:基于待识别图像的特征图,得到多个键实例特征和多个值实例特征;将所述多个键实例特征和所述多个值实例特征进行匹配,得到多个实例特征组合;对所述多个实例特征组合中的每个实例特征组合中的键实例特征和值实例特征进行融合,得到所述每个实例特征组合所对应的融合特征;基于与所述多个实例特征组合分别对应的多个融合特征,得到所述待识别图像的多个键值识别结果。根据本公开的技术,可以充分利用图像中键实例丰富的语义信息,帮助值实例实现更好的分类解析,输出更加准确的图像识别结果。
-
公开(公告)号:CN114842489A
公开(公告)日:2022-08-02
申请号:CN202210521847.9
申请日:2022-05-13
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/412 , G06V30/413 , G06V10/44
Abstract: 本公开提供了一种表格解析方法、装置、设备、存储介质以及计算机程序产品,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:获取待解析的表格图像;对表格图像进行特征提取,得到多个字段特征;对多个字段特征进行行列分类,得到每个字段特征的行列属性;基于行列属性,对多个字段特征对应的文本进行排列,得到解析后的文本表格。提高了表格解析的准确性。
-
公开(公告)号:CN114037991A
公开(公告)日:2022-02-11
申请号:CN202111310505.4
申请日:2021-11-03
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/14 , G06V20/62 , G06V30/18 , G06V30/19 , G06K9/62 , G06V10/82 , G06T7/00 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种图像质量的确定方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于光学特征识别等场景。具体实现方案为:确定目标图像在不同维度的特征信息;根据图像识别需求,从不同维度的特征信息中确定目标维度的特征信息;利用目标维度的特征信息,确定目标图像的质量。可以实现有效的控制图像识别中的输入图像的质量的效果。
-
公开(公告)号:CN115497113B
公开(公告)日:2023-11-14
申请号:CN202211219460.4
申请日:2022-09-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/412 , G06V30/18 , G06V30/19 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/045
Abstract: 本公开提供了一种信息生成方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及图像处理、计算机视觉和深度学习技术领域,可应用于OCR等场景。具体实现方案为:对文本表格图像进行处理,得到文本表格图像中各文本区域的局部特征信息和文本识别信息;对局部特征信息进行列分类,得到各文本区域的列分类信息;根据局部特征信息,确定各文本区域之间的相似度;根据相似度,确定各文本区域的行分类信息;根据行分类信息、列分类信息和文本识别信息,生成文本表格图像的结构化信息。
-
公开(公告)号:CN115497113A
公开(公告)日:2022-12-20
申请号:CN202211219460.4
申请日:2022-09-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/412 , G06V30/18 , G06V30/19 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种信息生成方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及图像处理、计算机视觉和深度学习技术领域,可应用于OCR等场景。具体实现方案为:对文本表格图像进行处理,得到文本表格图像中各文本区域的局部特征信息和文本识别信息;对局部特征信息进行列分类,得到各文本区域的列分类信息;根据局部特征信息,确定各文本区域之间的相似度;根据相似度,确定各文本区域的行分类信息;根据行分类信息、列分类信息和文本识别信息,生成文本表格图像的结构化信息。
-
公开(公告)号:CN113627439A
公开(公告)日:2021-11-09
申请号:CN202110921811.5
申请日:2021-08-11
Applicant: 北京百度网讯科技有限公司
IPC: G06K9/34 , G06F16/332 , G06F16/35 , G06F40/30
Abstract: 本公开提供了一种文本结构化处理方法、处理装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到与文本图像对应的至少一个文本检测框的类别信息,其中,类别信息包括关键字类别或数值类别;确定与至少一个文本检测框中的目标文本检测框对应的文本图像;对与目标文本检测框对应的文本图像进行文本识别,得到与目标文本检测框对应的文本图像的文本识别结果;对文本识别结果进行文本分类,得到与文本识别结果对应的语义类别结果;生成文本结构化结果,其中,文本结构化结果包括与关键字类别对应的值和与数值类别对应的值。
-
-
-
-
-
-
-
-
-