-
公开(公告)号:CN118608385A
公开(公告)日:2024-09-06
申请号:CN202410702281.9
申请日:2024-06-02
Applicant: 复旦大学
IPC: G06T3/4053 , G06T3/4046 , G06V10/80 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明属于计算机图像处理领域,具体为一种具有语义引导的高效场景文本图像超分辨率方法。本发明方法包括:将图像输入CNN编码器和特征融合模块,准确提取图像的视觉特征,将视觉特征与高级指导信息进行融合,输入到顺序残差块,以像素重组的方式生成超分辨率图像;其中:高级指导信息是通过先将图像输入文本识别模型并进行自注意力计算,得到语义特征,再将语义特征输入到由自注意力和交叉注意力机制组成的视觉‑语义对齐模块中通过交叉注意力机制进行对齐得到;本发明提出的方法能够高效重建超分辨率场景文本图像,并且模型以更少的计算成本实现了优异的性能。
-
公开(公告)号:CN118608427A
公开(公告)日:2024-09-06
申请号:CN202410702276.8
申请日:2024-06-02
Applicant: 复旦大学
IPC: G06T5/77 , G06T5/70 , G06T3/4007 , G06T5/50 , G06N3/0464 , G06N3/08 , G06N5/04 , G06V10/80
Abstract: 本发明公开了一种基于扩散模型的加速图像修补方法,该方法通过两阶段反向扩散过程从随机高斯噪声中采样实现最终图像修复的结果,两阶段分为粗略阶段和精细阶段;首先在粗略阶段从随机高斯噪声中采样出粗略结果;然后将粗略结果进行上采样得到作为精细阶段的图像先验的上采样的粗略结果,以上采样的粗略结果添加噪声作为精细阶段的输入,通过精细阶段采样生成细化结果,实现最终图像的修复;在两个阶段,分别通过条件去噪模块CDM去噪,条件重采样模块CRM使修复效果更加和谐;实验结果表明,本发明在原有基于扩散模型的方法上保持修补精度的同时,实现了约60倍的加速。
-
公开(公告)号:CN111738300A
公开(公告)日:2020-10-02
申请号:CN202010463642.0
申请日:2020-05-27
Applicant: 复旦大学
Abstract: 本发明公开了一种交通标志及信号灯检测和识别的优化算法;该算法分为特征提取阶段、区域候选阶段、层次分类阶段。特征提取阶段引入Ghost bottleneck模块构建特征提取网络,在ImageNet上进行大数据训练,得到预训练模型,通过预训练后的特征提取网络提取图像特征,并对特征图进行池化处理;区域候选阶段采用RPN子网获取候选区域,对候选区域对应的特征图进行裁剪和缩放,使得待分类的特征子图尺寸相同;层次分类阶段通过层次分类的方法对图像进行分类,识别出交通信号灯和交通标志。本发明的算法较之基线算法在各方面性能都得到极大提升,能满足自动驾驶系统的实时性、可靠性要求。
-
公开(公告)号:CN111738255A
公开(公告)日:2020-10-02
申请号:CN202010463634.6
申请日:2020-05-27
Applicant: 复旦大学
Abstract: 本发明公开了一种基于深度学习的路牌文本检测与识别算法。本算法分为文本区域检测阶段和文本识别两阶段。文本区域检测阶段将文本区域检测作为实例分割问题,采用改进的VGG网络进行特征提取,经特征融合获取实例分割结果,然后基于分割结果再处理得到文本区域;文本识别阶段,将文本区域检测阶段的结果作为输入,经卷积阶段、循环阶段和转录阶段识别文本,卷积阶段利用卷积神经网络提取图像的特征图,循环阶段利用双向LSTM预测特征图中的特征序列,转录阶段整合循环阶段预测的文本并翻译成文本识别结果;最后进一步处理得到最终的文本识别结果。该算法能够很好的处理自然场景下的路牌图像,在公开数据集上取得了较好的结果。
-
-
-