-
公开(公告)号:CN111401372B
公开(公告)日:2024-04-16
申请号:CN201911326611.4
申请日:2019-12-20
Applicant: 国家电网有限公司 , 国网湖北省电力有限公司信息通信公司
IPC: G06V30/148 , G06V30/146 , G06V30/168
Abstract: 本发明涉及一种扫描文档图文信息提取与鉴别的方法,该方法包括以下步骤:1)将扫描的文档图像进行预处理,并将预处理后图像进行版面分割,选出包括但不限于签名、印章;2)将1)提取的签名经过预处理,采用OTSU算法去除背景后,输入到Writer‑Dependent网络中提取其特征值,再输入至使用真实签名训练得到的SVM分类器中,得到该签名的真伪性;3)将1)提取的印章经过预处理后进行极坐标转化,使得印章内部的环形文字展开为横向排列文字,将展开后的文字输入到CPTN+CRNN网络中依次进行提取和识别,输出印章的文字内容;4)判断该文档的有效性。本发明能够代替人工对文档进行分析与判断。
-
公开(公告)号:CN111401372A
公开(公告)日:2020-07-10
申请号:CN201911326611.4
申请日:2019-12-20
Applicant: 国家电网有限公司 , 国网湖北省电力有限公司信息通信公司
Abstract: 本发明涉及一种扫描文档图文信息提取与鉴别的方法,该方法包括以下步骤:1)将扫描的文档图像进行预处理,并将预处理后图像进行版面分割,选出包括但不限于签名、印章;2)将1)提取的签名经过预处理,采用OTSU算法去除背景后,输入到Writer-Dependent网络中提取其特征值,再输入至使用真实签名训练得到的SVM分类器中,得到该签名的真伪性;3)将1)提取的印章经过预处理后进行极坐标转化,使得印章内部的环形文字展开为横向排列文字,将展开后的文字输入到CPTN+CRNN网络中依次进行提取和识别,输出印章的文字内容;4)判断该文档的有效性。本发明能够代替人工对文档进行分析与判断。
-