-
公开(公告)号:CN119559075A
公开(公告)日:2025-03-04
申请号:CN202411696703.2
申请日:2024-11-26
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于边缘信息引导的伪监督学习交通图像质量增强方法,旨在解决因“欠曝”“过曝”现象导致的目标检测精度下降问题,所述方法如下:首先,设计一种基于可见光图像‑SAM掩码的视觉内容生成器,分别提取图像、掩码特征并进行深度融合,以生成对应的增强矩阵γ;其次,设计伪标签生成器,利用输入图像随机生成2N个参考图像,旨在为模型提供丰富的参考数据,增强模型的泛化性和鲁棒性;再次,构建全局‑局部图像质量评估器评估参考图像的图像质量,选取质量最好的图像作为伪标签;最后,引入L1‑SSIM作为模型的结构重建损失,有效捕捉图像的细节和结构信息,在提升图像质量的同时保证图像的视觉连贯性。
-
公开(公告)号:CN119992534A
公开(公告)日:2025-05-13
申请号:CN202510051371.0
申请日:2025-01-13
Applicant: 北京工业大学
Abstract: 一种基于多源多表示信息融合的3D目标检测方法,涉及智能驾驶感知领域。本发明将输入的3D点云数据体素化,通过体素特征编码层实现体素内逐点特征的聚合;使用DeepLabv3模型作为2D骨干网络提取图像特征;提出了图像特征索引方法,对图像特征和体素特征进行对齐,将体素特征和相应图像特征融合得到多模态特征;使用3D稀疏卷积网络从多模态特征中提取深层特征,将深层特征转化为鸟瞰图特征;通过距离投影将输入的3D点云数据转化为距离视图表示,提出了频率感知的自适应扩张卷积网络,从距离图像中提取多尺度特征;将距离特征转化到鸟瞰图,与从多模态特征得到的鸟瞰图特征拼接进行3D目标检测。本发明提升了3D目标检测精度。
-
公开(公告)号:CN119723501A
公开(公告)日:2025-03-28
申请号:CN202411906590.4
申请日:2024-12-23
Applicant: 北京工业大学
IPC: G06V20/56 , G06V10/44 , G06V10/42 , G06T7/50 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464
Abstract: 一种基于三维空间筛选局部体素特征的3D车道线检测方法属于自动驾驶领域。现有方法将前视摄像头特征汇总到网格中构建BEV(鸟瞰图)特征。图像特征转换为体素特征后沿高度维度对三维空间进行扁平化处理为BEV特征时,无法突出不同高度的车道线特征。本发明利用LSS(Lift,Splat,Shoot)预测像素的深度信息,将图像特征转换为三维空间体素特征。基于高度对三维体素特征分层处理,分别进行全局池化和局部池化,提取全局体素特征和局部体素特征进行融合,将融合后的BEV特征。针对车道线在图像中具有细长的特点,在特征提取阶段,提出了基于特征金字塔的条状卷积注意力模块,显著扩大感受野,提升对车道线特征的捕获能力。本发明实现高精度的3D车道线检测。
-
-