一种基于生成对抗网络的视频密集事件描述方法

    公开(公告)号:CN111368142B

    公开(公告)日:2023-06-06

    申请号:CN202010296654.9

    申请日:2020-04-15

    Abstract: 本发明公开了一种基于生成对抗网络的视频密集事件描述方法,属于深度学习和图像识别领域。包括:构建视频密集事件描述网络;该网络包括:视频特征提取模块,对视频帧进行特征提取,得到视频帧特征;时序动作特征提取模块,利用视频前向传播与反向传播的特点进行视频帧特征学习,得到各个时序动作特征;自然语言编码器,利用注意力机制融合视频帧特征与时序动作特征,得到自然语句;鉴别器,强化自然语句的准确性;利用训练好的视频密集事件描述模型进行视频密集事件描述。本发明充分考虑了视频双向传播的特点,同时学习自然语句生成时充分利用了视频特征及时序动作特征,并构建语法鉴别器与内容鉴别器,有效强化了自然语句准确性。

    一种基于生成对抗网络的视频密集事件描述方法

    公开(公告)号:CN111368142A

    公开(公告)日:2020-07-03

    申请号:CN202010296654.9

    申请日:2020-04-15

    Abstract: 本发明公开了一种基于生成对抗网络的视频密集事件描述方法,属于深度学习和图像识别领域。包括:构建视频密集事件描述网络;该网络包括:视频特征提取模块,对视频帧进行特征提取,得到视频帧特征;时序动作特征提取模块,利用视频前向传播与反向传播的特点进行视频帧特征学习,得到各个时序动作特征;自然语言编码器,利用注意力机制融合视频帧特征与时序动作特征,得到自然语句;鉴别器,强化自然语句的准确性;利用训练好的视频密集事件描述模型进行视频密集事件描述。本发明充分考虑了视频双向传播的特点,同时学习自然语句生成时充分利用了视频特征及时序动作特征,并构建语法鉴别器与内容鉴别器,有效强化了自然语句准确性。

Patent Agency Ranking