-
公开(公告)号:CN117636379A
公开(公告)日:2024-03-01
申请号:CN202311712089.X
申请日:2023-12-13
Applicant: 西安电子科技大学
IPC: G06V30/412 , G06V30/146 , G06V10/82 , G06V30/168 , G06N3/044 , G06N3/0464 , G06N3/084
Abstract: 一种基于深度学习的表格识别方法,包括:获取包含表格的图像数据集;提取数据集中图像的表格区域,并利用投影变换矫正表格区域;再得到表格图像;提取出表格图像中的单元格图像作为文本框识别网络训练集;对yolov8检测网络进行训练;将待识别单元格图像输入训练好的文本块检测网络,输出重新排序后的文本块图像;输出文本块图像中的文本;将文本块图像中的文本输出到excel;本发明解决了现有技术中存在的识别稳定性受表格图像规范度影响较大以及现有技术中识别速度和准确率之间的平衡问题,能够准确地从包含表格的图像中识别所包含的全部表格,包括表格结构与内容信息,有助于提高结构化数据处理的效率与准确性,具有更强的实用性。
-
公开(公告)号:CN117423127A
公开(公告)日:2024-01-19
申请号:CN202311431915.3
申请日:2023-10-31
Applicant: 西安电子科技大学
IPC: G06V30/413 , G06V30/19 , G06V30/14 , G06V30/146 , G06V10/82 , G06N3/084
Abstract: 一种基于坐标聚类的缺线表格信息识别方法,首先将表格图像输入YOLOv8模型中,预测出所有文本块的位置坐标,接着对所有文本块做初步行列标记识别出初始行列,然后对聚类失误的文本块进行二次标记,并据此计算缺线位置的坐标,补齐所有表格线,最后将表格转化为电子格式输出;本发明能够准确地识别缺线表格的信息并写入Excel,减少了文本标记错误导致的识别错误,能够解决现有表格识别技术中存在的识别准确率较低和运算量较大大、部署困难的问题;提高了表格识别的准确率,且便于部署在移动端,具有更强的实用性。
-
公开(公告)号:CN116524517A
公开(公告)日:2023-08-01
申请号:CN202310333284.5
申请日:2023-03-31
Applicant: 西安电子科技大学
IPC: G06V30/19 , G06V30/14 , G06V30/146 , G06V10/82 , G06V30/18 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于深度学习的电能表图像目标识别方法,解决现有技术中存在的检测准确率受图像拍摄条件影响较大、深度学习方法运算量大和部署困难的问题。其方案为:利用电能表图像生成三个训练集,选择yolox‑nano网络作为训练网络,分别训练得到感兴趣区域检测网络、表盘信息识别网络和条形码信息识别网络;将待检测图像输入感兴趣区域检测网络,得到表盘和条形码图像,将其分别输入对应的信息识别网络;根据相应公式计算识别结果。本发明能够准确地识别电能表的示数及其条码信息,以便及时发现异常并采取相应措施,运算量较小便于部署在移动端,具有更强的实用性。
-
-