发明授权
CN102169542B 文字识别中粘连字符的切分方法和装置
失效 - 权利终止
- 专利标题: 文字识别中粘连字符的切分方法和装置
- 专利标题(英): Method and device for touching character segmentation in character recognition
-
申请号: CN201010114226.6申请日: 2010-02-25
-
公开(公告)号: CN102169542B公开(公告)日: 2012-11-28
- 发明人: 王琛
- 申请人: 汉王科技股份有限公司
- 申请人地址: 北京市海淀区东北旺西路8号5号楼三层
- 专利权人: 汉王科技股份有限公司
- 当前专利权人: 汉王科技股份有限公司
- 当前专利权人地址: 北京市海淀区东北旺西路8号5号楼三层
- 主分类号: G06K9/34
- IPC分类号: G06K9/34
摘要:
本发明公开了文字识别中粘连字符的切分方法和装置,属于文字识别领域。方法包括:预处理后获得行图像的连通域、平均字宽和平均字高。进行连通域分析,标记粘连的连通域,对选定的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域保存字块。根据预切分点对提取完毕的笔画进行合并,得到字块。保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列。根据参考信息对字块进行合并,输出识别结果。本发明依据预切分点对笔画进行合并得到字块,保证了更大范围的切分点被检测到;用轮廓信息预检测切分点的方式作为合并时的参数,避免了正确的切分点被合并而带来的合并错误。
公开/授权文献
- CN102169542A 文字识别中粘连字符的切分方法和装置 公开/授权日:2011-08-31