一种基于深度神经网络的表格快速自动提取方法

    公开(公告)号:CN112883795B

    公开(公告)日:2023-01-31

    申请号:CN202110068949.5

    申请日:2021-01-19

    Abstract: 架空输电线路的设计资料通常以图片表格、PDF表格等形式出现,且不同设计单位提供的资料格式、表现形式均有所区别,表格资料不能被计算机直接读取,需要进行人工手动输入,工作量大、速度慢。针对此问题,本发明公开了一种基于深度神经网络的表格快速自动提取方法,包括:步骤S1:进行图像表格矫正预处理;步骤S2:进行图像表格框线提取,得到裁剪出来的单元格图片Q(i);步骤S3:进行单元格文字定位;步骤S4:单元格文字识别;步骤S5:对所有单元格识别结果进行顺序合并,实现表格自动快速提取。该方法与现有的人工目视解译或者基于单字分割的表格提取方法相比,速度更快、自动化程度更高、识别更为准确和完整、泛化能力更强、效率更高,对于多源异构、复杂的图像表格数据依然可以保持较好的提取效果,便于验收项判定与验收工作管理。

Patent Agency Ranking