- 专利标题: 自然场景文字识别方法、系统、设备及存储介质
-
申请号: CN202310623773.4申请日: 2023-05-30
-
公开(公告)号: CN116343190A公开(公告)日: 2023-06-27
- 发明人: 张勇东 , 王裕鑫 , 谢洪涛
- 申请人: 中国科学技术大学
- 申请人地址: 安徽省合肥市包河区金寨路96号
- 专利权人: 中国科学技术大学
- 当前专利权人: 中国科学技术大学
- 当前专利权人地址: 安徽省合肥市包河区金寨路96号
- 代理机构: 北京凯特来知识产权代理有限公司
- 代理商 韩珂; 郑立明
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V30/19 ; G06V10/82 ; G06N3/045 ; G06N3/0455
摘要:
本发明公开了一种自然场景文字识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:将图像编码到向量空间,从而被赋予局部和全局多粒度语义,并聚合得到全局向量,再并行生成不同时间步通道注意力图,从而解码出不同时间步的字符信息,由于采用向量到序列的解码方式,不仅可以提升识别速度,同时,由于不同字符在通道空间中共享一些特征表达(例如注意力图被较强地激活),但一些具有区分力特征的通道权重也存在一定差异,因此,可以确保全局向量能够在低质量注意力图的情况下,也能生成鲁棒的字符特征表达(例如缺少对共享通道特征的关注不会影响区分力通道特征的表达),因而,本发明提供的方案可以准确的识别自然场景的文字。
公开/授权文献
- CN116343190B 自然场景文字识别方法、系统、设备及存储介质 公开/授权日:2023-08-29