一种基于多尺度分层残差网络的图像多字幕自动生成方法
摘要:
本发明公开了一种基于多尺度分层残差网络的图像多字幕自动生成方法,该方法应用了改进的漏斗网络捕捉多尺度目标信息。首先在构建漏斗框架网络时提出了一种密集连接聚合残差块,为了解决梯度消失和梯度爆炸问题,进一步提出了残差LSTM。该方法取得了较高的实验性能,在多字幕获取任务上有明显优势。
0/0