- 专利标题: 一种基于多尺度分层残差网络的图像多字幕自动生成方法
-
申请号: CN201710896059.7申请日: 2017-09-28
-
公开(公告)号: CN107844743B公开(公告)日: 2020-04-28
- 发明人: 田彦 , 王勋 , 黄刚
- 申请人: 浙江工商大学
- 申请人地址: 浙江省杭州市下沙高教园区学正街18号
- 专利权人: 浙江工商大学
- 当前专利权人: 浙江工商大学
- 当前专利权人地址: 浙江省杭州市下沙高教园区学正街18号
- 代理机构: 杭州天勤知识产权代理有限公司
- 代理商 胡红娟
- 主分类号: G06K9/00
- IPC分类号: G06K9/00 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种基于多尺度分层残差网络的图像多字幕自动生成方法,该方法应用了改进的漏斗网络捕捉多尺度目标信息。首先在构建漏斗框架网络时提出了一种密集连接聚合残差块,为了解决梯度消失和梯度爆炸问题,进一步提出了残差LSTM。该方法取得了较高的实验性能,在多字幕获取任务上有明显优势。
公开/授权文献
- CN107844743A 一种基于多尺度分层残差网络的图像多字幕自动生成方法 公开/授权日:2018-03-27