-
公开(公告)号:CN116363610A
公开(公告)日:2023-06-30
申请号:CN202310347944.5
申请日:2023-03-31
Applicant: 河南大学
Abstract: 本发明涉及旋转车辆目标检测技术领域,具体涉及一种基于改进YOLOv5的航拍车辆旋转目标检测方法,该方法包括:构建基于改进YOLOv5的航拍车辆旋转目标检测模型;构建航拍车辆检测数据集;利用边界框损失函数、置信度损失函数、类别损失函数、角度分类损失函数对航拍车辆旋转目标检测网络进行训练;检测训练好的模型,根据检测结果对模型进行评估,判断是否满足实际需求;若满足实际需求则把训练好的模型用于航拍情况下的车辆检测;若不满足实际需求则对模型进行修正后再继续训练,直至能满足实际需求。最终模型对于航拍车辆旋转目标取得了良好的检测效果,有效处理了航拍情况下对车辆旋转目标检测效果较差和计算量大的问题。
-
公开(公告)号:CN115439565A
公开(公告)日:2022-12-06
申请号:CN202210996920.8
申请日:2022-08-18
Applicant: 河南大学
Abstract: 本发明提供了一种基于Transformer的图像压缩方法,主要包括如下步骤:构建基于Transformer的深度图像压缩模型;建立用于深度压缩模型的训练集、验证集和测试集;最后将处理好的深度图像压缩数据集送入构建好的基于Transformer深度图像压缩模型进行训练;通过预设方式对基于Transformer深度图像压缩模型进行优化,并重复迭代训练及优化的过程,直至损失函数趋近于恒定值时停止迭代训练并输出优化后的基于Transformer深度图像压缩模型;利用训练好的Transformer深度图像压缩模型对图像进行压缩和重建并对压缩结果进行评价或进一步对其进行分析和理解。本发明所述方法使用了先进的Transformer特征提取网络显著提升压缩图像的质量,并在很大程度上节省图像存储开销。本发明在图像存储、传输、分析等领域具有重要的应用价值。
-
公开(公告)号:CN119149482A
公开(公告)日:2024-12-17
申请号:CN202411014573.X
申请日:2024-07-26
Applicant: 河南大学
IPC: G06F15/78 , G06V10/764 , G06V10/40 , G06V10/774
Abstract: 本发明公开了一种面向YOLOv5枣类创伤目标检测的FPGA硬件加速系统、方法、存储介质和电子设备,包括ARM端、FPGA端、AXI总线以及外部存储设备SD卡;ARM端负责读取DDR中的数据、各个模块初始化、调度整个YOLOv5算法网络的前向推理、Yolo Head检测和非极大值抑制得到检测框;FPGA端主要包括步长为2和1的3×3卷积IP、步长为1的1×1卷积IP、上采样IP、步长为2的5×5最大池化IP以及矩阵加法IP;ARM端和FPGA端通过AXI总线连接。本发明通过采用了单个计算单元分时复用的架构,同时采用了最大分块传输计算的策略,极大地减少了FPGA资源量的占用,具有较高的可靠性和实时性。
-
公开(公告)号:CN114463176B
公开(公告)日:2024-03-01
申请号:CN202210098160.9
申请日:2022-01-25
Applicant: 河南大学
IPC: G06T3/4053 , G06T3/4046 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0499 , G06N3/084 , G06N3/0475 , G06N3/094 , G06N3/048
Abstract: 本发明公开一种基于改进ESRGAN的图像超分辨重建的方法,其步骤为:建立超分辨图像数据集;构建基于改进ESRGAN的图像超分辨重建深度学习模型;训练改进ESRGAN的图像超分辨重建深度学习模型;测试模型的性能;评估模型;判断模型评估结果;修正基于改进ESRGAN的图像超分辨重建深度学习模型的参数;调用模型进行检测。本发明通过在ESRGAN的生成器(G)中加入胶囊网络,使其更能“理解”图像,表达能力较强,通过胶囊建立了图像三维之间的关系,输出的向量也可以反应图像状态。通过加入残差注意力机制,使模型生成的特征更具判别度,能持续提高模型的性能。
-
公开(公告)号:CN114463176A
公开(公告)日:2022-05-10
申请号:CN202210098160.9
申请日:2022-01-25
Applicant: 河南大学
Abstract: 本发明公开一种基于改进ESRGAN的图像超分辨重建的方法,其步骤为:建立超分辨图像数据集;构建基于改进ESRGAN的图像超分辨重建深度学习模型;训练改进ESRGAN的图像超分辨重建深度学习模型;测试模型的性能;评估模型;判断模型评估结果;修正基于改进ESRGAN的图像超分辨重建深度学习模型的参数;调用模型进行检测。本发明通过在ESRGAN的生成器(G)中加入胶囊网络,使其更能“理解”图像,表达能力较强,通过胶囊建立了图像三维之间的关系,输出的向量也可以反应图像状态。通过加入残差注意力机制,使模型生成的特征更具判别度,能持续提高模型的性能。
-
-
-
-