-
公开(公告)号:CN119360392A
公开(公告)日:2025-01-24
申请号:CN202411323395.9
申请日:2024-09-23
Applicant: 浙江大学
IPC: G06V30/19 , G06F40/18 , G06F40/186 , G06F40/143 , G06F9/451 , G06F9/455 , G06F8/30
Abstract: 一种基于网页渲染的表格识别数据合成方法和装置,其方法包括:随机生成表格的尺寸大小;随机生成合并单元格的数量、位置以及合并跨度;生成表格的样式参数,包含边框样式、边框颜色、背景颜色、字体大小、字体颜色、对齐方式;使用GPT4模型生成匹配该表格结构的符合正常语义的表格填充文本;生成表格的HTML表示文件和CSS样式文件;生成JavaScript脚本文件,配置HTML前端渲染后所需要的截图参数设置和获取基于HTML语言表示的表格各单元格元素的坐标框位置的函数逻辑;在网页浏览器中渲染已生成的HTML文件,并使用已生成的JavaScript脚本进行网页截图,得到合成的表格图像,同时保留表格中各单元格的坐标框位置信息,最后结合HTML文件和保留的单元格坐标框位置信息,生成完整的表格识别标注内容。最后,系统将标注结果保存为JSON格式文件。
-
公开(公告)号:CN117710999A
公开(公告)日:2024-03-15
申请号:CN202410028111.7
申请日:2024-01-08
Applicant: 浙江大学
IPC: G06V30/412 , G06V30/414 , G06V30/14 , G06V30/148 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的电商表格图像识别方法和装置,其方法包括:对输入的电商商品详情页图像进行表格区域检测,得到其中表格区域的矩形框坐标;根据表格区域的矩形框坐标裁剪出表格内容图像;对表格内容图像进行表格结构识别,得到各个单元格区域的矩形框坐标和行列位置信息;采用文本OCR模型获取表格内容图像内文本行区域的矩形框坐标和对应的文字信息;根据文本行区域矩形框和单元格区域矩形框之间的交并比匹配各单元格所包含的文字信息,得到电商表格图像的识别结果。本发明具备较好的表格识别准确性,且普适性强,可以用于复杂电商表格图像识别场景。
-