-
公开(公告)号:CN118505504B
公开(公告)日:2025-04-29
申请号:CN202410500537.8
申请日:2024-04-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T3/4053 , G06T3/4046 , G06T3/4038 , G06V30/16 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/084
Abstract: 本发明属于图像处理技术领域,且公开了一种面向文本图像的超分辨率方法,包括:生成文本超分数据集,识别并转换图像中目标文本区域为矩形,以便输入超分网络,提取待超分图像的特征,得到特征图X0,利用文本先验提取模块生成注意力图A,将特征图X0与注意力图A通过多个带注意力机制的残差块进行升维,得到特征图Xn,对特征图Xn进行像素和通道重组,生成超分图像SR,计算SR图像的文本序列损失lctc和像素间损失l2,求得总损失l。通过迭代优化网络参数,评估模型性能,将SR图像输入文本识别模型,获取预测文本,逆变换后拼接到原图,增强视觉效果,有效解决了传统超分模型对于文本图像质量的提升效果有限甚至产生负优化效果的问题。
-
公开(公告)号:CN118505504A
公开(公告)日:2024-08-16
申请号:CN202410500537.8
申请日:2024-04-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T3/4053 , G06T3/4046 , G06T3/4038 , G06V30/16 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/084
Abstract: 本发明属于图像处理技术领域,且公开了一种面向文本图像的超分辨率方法,包括:生成文本超分数据集,识别并转换图像中目标文本区域为矩形,以便输入超分网络,提取待超分图像的特征,得到特征图X0,利用文本先验提取模块生成注意力图A,将特征图X0与注意力图A通过多个带注意力机制的残差块进行升维,得到特征图Xn,对特征图Xn进行像素和通道重组,生成超分图像SR,计算SR图像的文本序列损失lctc和像素间损失l2,求得总损失l。通过迭代优化网络参数,评估模型性能,将SR图像输入文本识别模型,获取预测文本,逆变换后拼接到原图,增强视觉效果,有效解决了传统超分模型对于文本图像质量的提升效果有限甚至产生负优化效果的问题。
-