-
公开(公告)号:CN111818397B
公开(公告)日:2021-10-08
申请号:CN202010602795.9
申请日:2020-06-29
Applicant: 同济大学
IPC: H04N21/84 , H04N21/466 , G06N3/04 , G06K9/62
Abstract: 本发明涉及一种基于长短时记忆网络变体的视频描述生成方法,包括以下步骤:1)构建视频描述模型,该视频描述模型包括卷积神经网络、视频特征编码模块和描述生成模块;2)输入待描述的视频,通过卷积神经网络获取初始视频特征;3)将初始视频特征输入视频特征编码模块进行处理得到带有语义信息的全局视频特征;4)以初始视频特征和带有语义信息的全局视频特征共同输入描述生成模块,并对视频描述模型进行训练,并使用训练好的视频描述模型生成描述句子。与现有技术相比,本发明具有兼顾关键帧特征提取和全局特征提取、提升视频描述的质量和准确性等优点。
-
公开(公告)号:CN111368898A
公开(公告)日:2020-07-03
申请号:CN202010129973.0
申请日:2020-02-28
Applicant: 同济大学
Abstract: 本发明涉及一种基于长短时记忆网络变体的图像描述生成方法,该方法利用一图像描述模型生成待识别图像的图像描述,所述图像描述模型包括卷积神经网络、图像特征编码模块和描述生成模块,所述卷积神经网络获得待识别图像的初始图像特征,所述图像特征编码模块对初始图像特征进行处理,所述图像特征编码模块的输出和所述初始图像特征同时作为描述生成模块的输入,所述描述生成模块中,基于注意力机制和长短时记忆网络变体生成描述句子。与现有技术相比,本发明具有能显著提升图像描述的质量和准确性等优点。
-
公开(公告)号:CN111368898B
公开(公告)日:2022-10-25
申请号:CN202010129973.0
申请日:2020-02-28
Applicant: 同济大学
IPC: G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于长短时记忆网络变体的图像描述生成方法,该方法利用一图像描述模型生成待识别图像的图像描述,所述图像描述模型包括卷积神经网络、图像特征编码模块和描述生成模块,所述卷积神经网络获得待识别图像的初始图像特征,所述图像特征编码模块对初始图像特征进行处理,所述图像特征编码模块的输出和所述初始图像特征同时作为描述生成模块的输入,所述描述生成模块中,基于注意力机制和长短时记忆网络变体生成描述句子。与现有技术相比,本发明具有能显著提升图像描述的质量和准确性等优点。
-
公开(公告)号:CN111818397A
公开(公告)日:2020-10-23
申请号:CN202010602795.9
申请日:2020-06-29
Applicant: 同济大学
IPC: H04N21/84 , H04N21/466 , G06N3/04 , G06K9/62
Abstract: 本发明涉及一种基于长短时记忆网络变体的视频描述生成方法,包括以下步骤:1)构建视频描述模型,该视频描述模型包括卷积神经网络、视频特征编码模块和描述生成模块;2)输入待描述的视频,通过卷积神经网络获取初始视频特征;3)将初始视频特征输入视频特征编码模块进行处理得到带有语义信息的全局视频特征;4)以初始视频特征和带有语义信息的全局视频特征共同输入描述生成模块,并对视频描述模型进行训练,并使用训练好的视频描述模型生成描述句子。与现有技术相比,本发明具有兼顾关键帧特征提取和全局特征提取、提升视频描述的质量和准确性等优点。
-
-
-