-
公开(公告)号:CN107609549B
公开(公告)日:2021-01-08
申请号:CN201710854505.8
申请日:2017-09-20
Applicant: 北京工业大学
Abstract: 本发明公开一种自然场景下证件图像的文本检测方法:选取常用汉字制造汉字图片,形成数据集1,对标注好的证件图像进行随机的旋转、裁剪操作,再用泊松克隆的方式融合不同背景图,形成数据集2;采用数据集1对VGG16网络进行文字分类模型的训练,待模型收敛后,用得到的参数初始化全卷积神经网络模型,并用数据集2训练模型;用训练好的全卷积神经网络模型处理图像,根据最大概率的方法得到每个像素点的分类情况,形成文本‑非文本二值图;用连通区域的方法得到文本的区域将原图像二值化,仅提取文本‑非文本区域二值图中文本区域内的文字信息,得到文本二值图;通过最大方差方法矫正图像;对矫正后图像再次投影,精修文本‑非文本区域二值图。
-
公开(公告)号:CN107609549A
公开(公告)日:2018-01-19
申请号:CN201710854505.8
申请日:2017-09-20
Applicant: 北京工业大学
Abstract: 本发明公开一种自然场景下证件图像的文本检测方法:选取常用汉字制造汉字图片,形成数据集1,对标注好的证件图像进行随机的旋转、裁剪操作,再用泊松克隆的方式融合不同背景图,形成数据集2;采用数据集1对VGG16网络进行文字分类模型的训练,待模型收敛后,用得到的参数初始化全卷积神经网络模型,并用数据集2训练模型;用训练好的全卷积神经网络模型处理图像,根据最大概率的方法得到每个像素点的分类情况,形成文本-非文本二值图;用连通区域的方法得到文本的区域将原图像二值化,仅提取文本-非文本区域二值图中文本区域内的文字信息,得到文本二值图;通过最大方差方法矫正图像;对矫正后图像再次投影,精修文本-非文本区域二值图。
-