一种基于谱聚类的自然场景汉字分割方法

发明公开

请登陆查看更多内容

专利标题： 一种基于谱聚类的自然场景汉字分割方法
申请号： CN201911088817.8

申请日： 2019-11-08
公开(公告)号： CN111062393A

公开(公告)日： 2020-04-24
发明人: 赵凡 , 杨林林 , 张琳 , 闻治泉 , 武吉梅
申请人： 西安理工大学
申请人地址： 陕西省西安市碑林区金花南路5号
专利权人： 西安理工大学
当前专利权人： 上海欧蓓实业有限公司
当前专利权人地址： 陕西省西安市碑林区金花南路5号
代理机构： 西安弘理专利事务所
代理商 燕肇琪
主分类号： G06K9/34
IPC分类号： G06K9/34 ; G06K9/62

摘要：

本发明公开了一种基于谱聚类的自然场景汉字分割方法，具体为：首先，采用深度学习方法对场景图像进行文字区域定位，实现快速准确的文本框检测；其次，利用文字的强纹理性提取场景图像的显著图，在显著图上再进行MSER检测得到各个连通的汉字笔画、偏旁部首和英文字母，即一系列的字符候选框；再利用在图像中的几何位置关系得到各文本框中包含的字符框集合，并对各文本框中包含的字符框集合建立对应的无向图；最后，对各个无向图采用谱聚类进行分割，对各分割结果按照类间密度和类内散度之和达到最小找到最优的聚类结果，即为文本框中分割的各个汉字或英文字母。该方法在很大程度上可以提高汉字分割的准确度，进而提高中文的识别率。

公开/授权文献

CN111062393B 一种基于谱聚类的自然场景汉字分割方法公开/授权日：2021-12-17

信息查询

中国专利公布公告 Global Dossier Espacenet