发明公开
摘要:
本发明公开了一种基于谱聚类的自然场景汉字分割方法,具体为:首先,采用深度学习方法对场景图像进行文字区域定位,实现快速准确的文本框检测;其次,利用文字的强纹理性提取场景图像的显著图,在显著图上再进行MSER检测得到各个连通的汉字笔画、偏旁部首和英文字母,即一系列的字符候选框;再利用在图像中的几何位置关系得到各文本框中包含的字符框集合,并对各文本框中包含的字符框集合建立对应的无向图;最后,对各个无向图采用谱聚类进行分割,对各分割结果按照类间密度和类内散度之和达到最小找到最优的聚类结果,即为文本框中分割的各个汉字或英文字母。该方法在很大程度上可以提高汉字分割的准确度,进而提高中文的识别率。
公开/授权文献
- CN111062393B 一种基于谱聚类的自然场景汉字分割方法 公开/授权日:2021-12-17