一种基于块投影的藏文历史文献文本区域提取方法

    公开(公告)号:CN107862310B

    公开(公告)日:2021-10-26

    申请号:CN201710836675.3

    申请日:2017-09-17

    Inventor: 段立娟 张西群

    Abstract: 本发明涉及一种基于块投影的藏文历史文献文本区域提取方法。将采集的藏文历史文献图像预处理;将图像平分为N*N的图像块,利用连通区域的分类信息和角点密度信息对图像块进行过滤;通过分析过滤后的图像块的投影可以定位到文本区域的近似边界位置;通过文本区域的近似边界位置搜索文本区域的边缘;通过文本区域边缘矫正策略矫正文本区域边缘,得到较完整、规则的文本区域。本发明利用块投影,可以准确的定位出文本区域的位置、增强不同文本区域之间的间隔;本发明实现了藏文历史文献的文本区域提取,方法简单、高效、易于实现。实验表明,在较大的文本区域和较小的文本区域的像素精度阈值分别设为95%和90%的情况下,准确率为75.50%,召回率为98.11%,F值为85.33%。

    一种基于块投影的藏文历史文献文本区域提取方法

    公开(公告)号:CN107862310A

    公开(公告)日:2018-03-30

    申请号:CN201710836675.3

    申请日:2017-09-17

    Inventor: 段立娟 张西群

    Abstract: 本发明涉及一种基于块投影的藏文历史文献文本区域提取方法。将采集的藏文历史文献图像预处理;将图像平分为N*N的图像块,利用连通区域的分类信息和角点密度信息对图像块进行过滤;通过分析过滤后的图像块的投影可以定位到文本区域的近似边界位置;通过文本区域的近似边界位置搜索文本区域的边缘;通过文本区域边缘矫正策略矫正文本区域边缘,得到较完整、规则的文本区域。本发明利用块投影,可以准确的定位出文本区域的位置、增强不同文本区域之间的间隔;本发明实现了藏文历史文献的文本区域提取,方法简单、高效、易于实现。实验表明,在较大的文本区域和较小的文本区域的像素精度阈值分别设为95%和90%的情况下,准确率为75.50%,召回率为98.11%,F值为85.33%。

Patent Agency Ranking