一种多层级多模块协同视频感知编码优化方法及装置

    公开(公告)号:CN116193122A

    公开(公告)日:2023-05-30

    申请号:CN202310189604.4

    申请日:2023-03-02

    Abstract: 本发明公开了一种多层级多模块协同视频感知编码优化方法及装置,通过原始视频进行编码失真预测、帧级编码失真预测及帧级量化参数的推导;对原始视频的图像进行帧内/帧间预测,并将得到的预测图像与原始图像进行差计算,得到残差图像,通过预测的编码失真,对残差图像进行残差滤波,滤波后的残差图像基于残差块变换后,再根据预测的帧级编码失真和帧级量化参数,进行感知量化;基于感知量化参数进行率失真优化,优化帧内/帧间预测;构建感知质量增强网络,用于优化帧内/帧间预测;基于优化的帧内/帧间预测,对原始视频的图像进行预测、差计算、残差滤波、变换、感知量化后,进行熵编码。

    一种多模态深度感知的高精度集成动态手势识别方法

    公开(公告)号:CN118155290A

    公开(公告)日:2024-06-07

    申请号:CN202410442762.0

    申请日:2024-04-12

    Abstract: 本发明公开了一种多模态深度感知的高精度集成动态手势识别方法。首先获取动态手势数据集,应用2D和3D数据增强方法增加样本数量;然后将增强后的数据进行灰度变换,并分别输入3D‑CNN子网络、ConvLSTM子网络和TCN子网络分别提取手势序列特征;将手势序列特征直接或融合输入相应分类器;最后将分类器结果集成,输出最终的概率分布。本发明额外对数据进行了数据增强和灰度变换,在数据原有的多模态之外,增加了灰度2D和灰度3D模态,使得本方法能识别分辨率更低的输入图像;并且本发明使用了一种优化加权集成,能够更有效地优化的综合多模态的分类结果。

Patent Agency Ranking