-
公开(公告)号:CN115761773A
公开(公告)日:2023-03-07
申请号:CN202211472708.8
申请日:2022-11-17
Applicant: 上海交通大学
IPC: G06V30/412 , G06V10/82 , G06V30/14 , G06V30/148 , G06V30/413 , G06F40/18 , G06V30/19 , G06N3/0464
Abstract: 本发明提供了一种基于深度学习的图像内表格识别方法及系统,包括:步骤S1:通过深度神经网络在图像中识别并定位表格,得到表格外框的相对位置信息;步骤S2:基于相对位置信息截取表格图像,通过深度学习网络进行表格结构识别;步骤S3:根据获取的表格结构,通过OCR技术提取每个单元格内的记载的信息;步骤S4:根据识别的表格结构以及表格内记载的信息,生成可编辑的表格文档。本发明能识别任何带有表格的图像,并以很高的准确率返回表格的结构、各单元格信息和文字信息,使得图像表格数据电子化。
-
公开(公告)号:CN114004204A
公开(公告)日:2022-02-01
申请号:CN202111263283.5
申请日:2021-10-28
Applicant: 上海交通大学
IPC: G06F40/18 , G06V30/413 , G06V30/414 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于计算机视觉的表格结构重建与文字提取方法和系统,包括:步骤1:通过神经网络在PDF文档中识别并定位表格,得到表格所在的外框区域;步骤2:对PDF文档中的文字层进行解析,获取PDF文档中的文本间距;步骤3:根据框定的表格区域和本文间距,通过计算机视觉在表格区域内重建表格内框线结构;步骤4:根据表格内框线结构,从PDF文档中同位置处抽取文本信息;步骤5:根据表格内框线结构和对应文本信息,生成可编辑表格文件。本发明通过神经网络进行表格外框的识别,可以不通过人为给定表格外框区域,从而可以自动提取PDF文档中的所有表格,能够在无人监督的情况下批量提取大量PDF数据中的表格。
-
公开(公告)号:CN114004204B
公开(公告)日:2024-09-13
申请号:CN202111263283.5
申请日:2021-10-28
Applicant: 上海交通大学
IPC: G06F40/18 , G06V30/413 , G06V30/414 , G06V10/82
Abstract: 本发明提供了一种基于计算机视觉的表格结构重建与文字提取方法和系统,包括:步骤1:通过神经网络在PDF文档中识别并定位表格,得到表格所在的外框区域;步骤2:对PDF文档中的文字层进行解析,获取PDF文档中的文本间距;步骤3:根据框定的表格区域和本文间距,通过计算机视觉在表格区域内重建表格内框线结构;步骤4:根据表格内框线结构,从PDF文档中同位置处抽取文本信息;步骤5:根据表格内框线结构和对应文本信息,生成可编辑表格文件。本发明通过神经网络进行表格外框的识别,可以不通过人为给定表格外框区域,从而可以自动提取PDF文档中的所有表格,能够在无人监督的情况下批量提取大量PDF数据中的表格。
-
-