一种基于注意力机制的多频分析视频生成方法
摘要:
本发明公开了一种基于注意力机制的多频分析视频生成方法。本方法使用“编码器‑LSTM‑解码器”的网络结构根据历史视频序列的信息预测未来的视频序列:通过空间多频小波分解,解决预测模糊细节缺失的问题。利用时序多频小波分解得到沿时间轴不同频率下的特征图组合,让模型更好地感知视频中的过程性运动。运用注意力机制,将相邻帧之间的帧差图利用神经网络编码为注意力向量,让模型更好地感知瞬时运动特征。该方法提高了模型对视频序列中时空特征的提取能力,增强了预测精度和效率,并具备较强的泛化能力,具有一定社会价值和现实意义。
0/0