基于投影法的两阶段文档图像非线性失真校正方法

    公开(公告)号:CN109063704A

    公开(公告)日:2018-12-21

    申请号:CN201810730869.X

    申请日:2018-07-05

    CPC classification number: G06K9/3283 G06K9/344 G06K2209/01

    Abstract: 本发明公开一种基于投影法的两阶段文档图像非线性失真校正方法,1、对于取得的文档图像进行二值化预处理,使用边界检测和提取算法自适应地检测和提取有效区域边界,获得文档图像校正区域;2、对于经过预处理的文档图像,首先基于投影法提取文本行基线,然后选取基准点,构建扭曲表面变换模型进行第一阶段的校正,称为粗校正;3、在粗校正进行之后,对图像再次用投影法提取文本行基线,然后根据提取的文本行基线,以文本行为单位,对文本行中的连通区域进行更加细致的第二阶段校正,称为细校正。本发明能够克服了文档图像中透视、倾斜、扭曲变形等一系列非线性失真对于文档图像OCR识别的影响,提高了OCR识别的准确率。

Patent Agency Ranking