一种基于改进YOLOv5的水下图像目标检测方法与系统

    公开(公告)号:CN117197644A

    公开(公告)日:2023-12-08

    申请号:CN202310026246.5

    申请日:2023-01-09

    Abstract: 本发明公开了一种基于改进YOLOv5的水下图像目标检测方法与系统,涉及水下图像检测领域,本发明以YOLOv5模型为基础模型,使用归一化模块、门控卷积模块、GELU激活函数模块与正则化模块组成的特征处理模块,替换YOLOv5模型中C3模块内的Res残差模块,其通过归一化模块避免了特征数据落在激活函数的饱和区,减少了梯度消失的问题;通过门控卷积模块提升了模型的高阶空间交互性能,通过正则化模块帮助网络收敛,有效防止了网络过拟合;通过GELU激活函数模块为激活函数引入了随机性使得模型训练过程更加鲁棒,稳定了网络梯度流,因此,本发明通过替换后的C3模块,极大的提高了模型预测的准确度。

    一种基于视觉感知的视频码率控制编码方法

    公开(公告)号:CN116939208A

    公开(公告)日:2023-10-24

    申请号:CN202310880300.2

    申请日:2023-07-17

    Abstract: 本发明公开了一种基于视觉感知的视频码率控制编码方法,其针对立体视频中除第1帧外的所有右视点视频帧采用如下步骤进行编码:计算当前帧相对于前一帧的帧差图,计算帧差图中的像素点的局部方差值,进而计算像素点的时域感知因子;根据当前帧中的最大编码单元中的像素点的时域感知因子,计算最大编码单元的时域感知因子;结合最大编码单元的立体感知的MSE失真估值和时域感知因子,得到时域感知因子加权的立体感知的MSE失真估值,进而计算最大编码单元的临界感知权重以及分配比特时所占的目标比特数,在采用目标比特数更新编码参数后进行编码;优点是在保证编码质量的同时,能有效降低码率误差,提高码率控制精度,率失真性能显著提升。

Patent Agency Ranking