-
公开(公告)号:CN112464781B
公开(公告)日:2023-06-02
申请号:CN202011328157.9
申请日:2020-11-24
Applicant: 厦门理工学院
IPC: G06V30/413 , G06V20/62 , G06V10/82 , G06N3/042 , G06N3/049
Abstract: 本发明涉及一种基于图神经网络的文档图像关键信息提取及匹配方法,包括以下步骤:步骤1:构建用于获取关键文本所在区域边框位置的关键文本信息检测模型;步骤2:构建用于识别文字边框内的文字关键文本识别模型;步骤3:将待提取信息的文档图像依次通过关键文本信息检测模型和关键文本识别模型,获取全部子图的文字识别结果;步骤4:以关键文本边框为节点构建图,以图神经网络为基础网络分别对于每个文本框的节点进行聚合,并预测节点的关键文本节点类型;步骤5:以正则表达式以及领域规则库的方式修正关键文本的识别结果,并得到最终的提取及匹配结果。本发明实现高效提取文档图像中的关键元素,并且准确地为关键元素匹配相应键值。
-
公开(公告)号:CN112464781A
公开(公告)日:2021-03-09
申请号:CN202011328157.9
申请日:2020-11-24
Applicant: 厦门理工学院
Abstract: 本发明涉及一种基于图神经网络的文档图像关键信息提取及匹配方法,包括以下步骤:步骤1:构建用于获取关键文本所在区域边框位置的关键文本信息检测模型;步骤2:构建用于识别文字边框内的文字关键文本识别模型;步骤3:将待提取信息的文档图像依次通过关键文本信息检测模型和关键文本识别模型,获取全部子图的文字识别结果;步骤4:以关键文本边框为节点构建图,以图神经网络为基础网络分别对于每个文本框的节点进行聚合,并预测节点的关键文本节点类型;步骤5:以正则表达式以及领域规则库的方式修正关键文本的识别结果,并得到最终的提取及匹配结果。本发明实现高效提取文档图像中的关键元素,并且准确地为关键元素匹配相应键值。
-