-
公开(公告)号:CN118279922A
公开(公告)日:2024-07-02
申请号:CN202410382189.9
申请日:2024-04-01
Applicant: 南京理工大学
IPC: G06V30/412 , G06V30/19 , G06V30/18
Abstract: 本发明公开了一种基于两阶段多模态特征融合的无线表格结构识别方法、系统及存储介质,方法包括:对目标表格图像进行文本检测与识别,得到图像中文本行的位置和内容;提取文本行的多种模态特征;利用两阶段特征融合策略,得到文本行的多模态融合特征;构建以文本行为顶点且顶点间具有边关系的表格图;根据表格图,利用灵活上下文聚合器进行消息传递,得到迭代更新后的顶点特征;根据表格图中两个更新后的顶点特征,得到每条边的特征;利用分类器对每条边进行分类,根据边分类的结果,得到表格结构信息。本发明能够解决现有表格结构识别方案中识别无线表格结构不准确的问题,提高了无线表格结构识别的精度。