自然场景文字识别方法、系统、设备及存储介质
摘要:
本发明公开了一种自然场景文字识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:将图像编码到向量空间,从而被赋予局部和全局多粒度语义,并聚合得到全局向量,再并行生成不同时间步通道注意力图,从而解码出不同时间步的字符信息,由于采用向量到序列的解码方式,不仅可以提升识别速度,同时,由于不同字符在通道空间中共享一些特征表达(例如注意力图被较强地激活),但一些具有区分力特征的通道权重也存在一定差异,因此,可以确保全局向量能够在低质量注意力图的情况下,也能生成鲁棒的字符特征表达(例如缺少对共享通道特征的关注不会影响区分力通道特征的表达),因而,本发明提供的方案可以准确的识别自然场景的文字。
0/0