-
公开(公告)号:CN112257716A
公开(公告)日:2021-01-22
申请号:CN202011424315.0
申请日:2020-12-08
Applicant: 之江实验室
Abstract: 本发明涉及一种基于尺度自适应及方向注意力网络的场景文字识别方法,将输入图片映射到极坐标空间中得到极坐标图像,并利用卷积网络提取极坐标图像的特征J;利用深度卷积网络将图片在极坐标空间中的特征表达转换成高阶的语义特征F;对转换得到的高阶语义特征,利用字符感受野注意力机制对每个字符编码更相关区域的特征,获取鲁棒的特征表达并离散成为特征序列Q;利用双向长短记忆网络捕捉特征序列Q之间的上下文关系,获取特征序列H;将特征序列H输入至解码网络进行解析,生成语义顺序规则的文字字符串。本发明能有效识别任意语义方向的场景文字;对于不同尺度的字符能编码更加有效的特征表达,显著提升识别性能。