基于时序校正卷积的视频预测方法

    公开(公告)号:CN114758282B

    公开(公告)日:2022-12-06

    申请号:CN202210463423.1

    申请日:2022-04-28

    Inventor: 李平 张陈翰 王涛

    Abstract: 本发明公开了基于时序校正卷积的视频预测方法。本发明方法对给定的原始视频进行采样预处理获得视频帧序列,并将该序列输入时序上下文融合模块,得到融合外观特征图和融合时空编码特征图,同时将该序列输入时序卷积校正模块得到卷积校正张量;然后,将得到的融合外观特征图、融合时空编码特征图和卷积校正张量通过自适应卷积时空编码器生成预测时空编码特征图;最后将预测时空编码特征图通过时空记忆解码器进行解码,输出预测视频帧序列。本发明方法不仅能够依据不同时刻的视频帧对卷积核参数进行校正,还能通过时序上下文融合策略对当前视频帧和历史帧时空编码特征的内在关系进行建模,从而生成更高视觉质量的预测视频帧序列。

    基于时序校正卷积的视频预测方法

    公开(公告)号:CN114758282A

    公开(公告)日:2022-07-15

    申请号:CN202210463423.1

    申请日:2022-04-28

    Inventor: 李平 张陈翰 王涛

    Abstract: 本发明公开了基于时序校正卷积的视频预测方法。本发明方法对给定的原始视频进行采样预处理获得视频帧序列,并将该序列输入时序上下文融合模块,得到融合外观特征图和融合时空编码特征图,同时将该序列输入时序卷积校正模块得到卷积校正张量;然后,将得到的融合外观特征图、融合时空编码特征图和卷积校正张量通过自适应卷积时空编码器生成预测时空编码特征图;最后将预测时空编码特征图通过时空记忆解码器进行解码,输出预测视频帧序列。本发明方法不仅能够依据不同时刻的视频帧对卷积核参数进行校正,还能通过时序上下文融合策略对当前视频帧和历史帧时空编码特征的内在关系进行建模,从而生成更高视觉质量的预测视频帧序列。

    基于时空传播层次编解码器的视频预测方法

    公开(公告)号:CN113422952B

    公开(公告)日:2022-05-31

    申请号:CN202110534056.5

    申请日:2021-05-17

    Abstract: 本发明公开了基于时空传播层次编解码器的视频预测方法。本发明方法首先对给定的原始视频进行采样获得帧序列并输入至低层视觉记忆编码器,得到低层视觉编码特征和低层记忆状态特征;然后分别利用时空传播模块从低层视觉编码表示中提取时空编码特征,以及通过高层语义编码器提取高层语义特征;再将得到的低层视觉编码特征、低层记忆状态特征和高层语义编码特征通过层次特征解码器进行信息融合,输出预测视频帧。本发明方法不仅能够将低层视觉记忆特征和高层语义特征相融合,并通过时空传播模块使得低层视觉信息沿时序方向传播,还能利用视频首帧的先验知识一定程度上解决视频帧模糊问题,从整体上提高预测视频帧的清晰度和视觉质量。

    基于时空传播层次编解码器的视频预测方法

    公开(公告)号:CN113422952A

    公开(公告)日:2021-09-21

    申请号:CN202110534056.5

    申请日:2021-05-17

    Abstract: 本发明公开了基于时空传播层次编解码器的视频预测方法。本发明方法首先对给定的原始视频进行采样获得帧序列并输入至低层视觉记忆编码器,得到低层视觉编码特征和低层记忆状态特征;然后分别利用时空传播模块从低层视觉编码表示中提取时空编码特征,以及通过高层语义编码器提取高层语义特征;再将得到的低层视觉编码特征、低层记忆状态特征和高层语义编码特征通过层次特征解码器进行信息融合,输出预测视频帧。本发明方法不仅能够将低层视觉记忆特征和高层语义特征相融合,并通过时空传播模块使得低层视觉信息沿时序方向传播,还能利用视频首帧的先验知识一定程度上解决视频帧模糊问题,从整体上提高预测视频帧的清晰度和视觉质量。

Patent Agency Ranking