-
公开(公告)号:CN119580208A
公开(公告)日:2025-03-07
申请号:CN202411313188.5
申请日:2024-09-20
Applicant: 桂林电子科技大学
IPC: G06V20/56 , G06V20/40 , G06V20/64 , G06V10/25 , G06V10/764 , G06V10/766 , G06V10/80 , G06V10/82 , G06T7/246 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于DETR的3D目标检测与跟踪方法,方法包括:从LIDER相机获取连续帧的点云数据流;将连续帧的原始点云数据转换为规则的体素网格并提取其高维视频特征;学习了一组4D Tubelet Query,并利用时间自注意力和空间交叉注意力模块对视频片段的动态时空特性进行建模,以增强其表征能力;最后,本发明的模型对每个Tubelet Query进行边界框预测,使用集对集损失来衡量真实值与预测值之间的差异实现多目标跟踪任务的端到端学习。本发明通过设计Tubelet,深度挖掘并整合时空维度上的信息,将多目标跟踪任务简化为检测任务,以实现检测和跟踪任务的统一,减少了传统多目标跟踪对帧级检测器的严重依赖。
-
公开(公告)号:CN113989153A
公开(公告)日:2022-01-28
申请号:CN202111271072.6
申请日:2021-10-29
Applicant: 桂林电子科技大学
Abstract: 本发明属于图像增强技术,具体涉及一种基于循环卷积和多聚类空间的红外图像增强方法,包括如下步骤:S1,建立多尺度循环卷积模块,以若干半径不同的高斯卷积核建立多尺度卷积模块,并采用密集连接的方式将多层多尺度卷积模块连接起来处理图像细节;S2,采用K‑means算法对图像灰度值进行聚类分析图像聚类分析,采用最大贡献率法选取初始聚类中心;S3,采用二维高斯函数和旋转矩阵构建第i个角度的核函数作为模板核函数提取图像不同角度的轮廓信息。本实施例方法相对于现有的图像增强方法,输出的图像轮廓更清晰、细节信息更丰富,较原图像质量无论是细节、亮度等有了显著的提高。
-
公开(公告)号:CN119478355A
公开(公告)日:2025-02-18
申请号:CN202411522575.X
申请日:2024-10-28
Applicant: 桂林电子科技大学
IPC: G06V10/25 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0499
Abstract: 本发明公开了一种基于局部到全局多模态融合的3D目标检测方法,方法包括:首先获取点云及其关联的六视图图像,采用极坐标采样技术对点云进行密集化处理,并通过3D主干网络生成不同下采样率的体素特征,利用区域建议网络生成初始3D建议框;同时,使用2D主干网络从六视图图像中提取密集的语义图像特征。在多模态融合阶段,局部融合模块和全局融合模块协同工作,将多层次体素特征、语义图像特征、初始3D建议框以及原始点云的位置信息自适应地整合在一起,并通过动态聚合模块实现局部与全局融合特征间的信息交互。本发明利用局部到全局的跨模态融合,整合细粒度和整体特征,显著提升了3D目标检测性能。
-
公开(公告)号:CN119478213A
公开(公告)日:2025-02-18
申请号:CN202411505637.6
申请日:2024-10-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于无人机与边缘计算的三维重建方法,涉及无人机技术、边缘计算和三维场景重建领域。该方法包括:无人机携带单目相机对目标场景采集标清视频流;边缘计算设备实时接收和处理标清视频流,生成初步的低精度三维重建;边缘计算设备通过分析低精度重建结果识别出缺陷区域,对无人机的飞行路径进行优化;无人机根据优化的路径,对目标场景采集高清视频流;边缘计算设备对该高清视频流进行离线高精度三维重建,以提高重建场景的准确性和细节表达能力。本发明通过无人机、边缘计算端的协同工作,实现了采集过程中实时数据处理、反馈和决策,以及离线阶段高精度三维重建结果存储,有效提升了三维重建的实时性和准确性。
-
公开(公告)号:CN113191414A
公开(公告)日:2021-07-30
申请号:CN202110450853.5
申请日:2021-04-26
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种双线性金字塔网络花卉图像分类方法,该方法通过将需要分类的花卉原始图像的大小调整至224*224,并随机裁剪为192*192;然后将调整后的图像通过双线性金字塔网络对花卉图像进行特征提取;最后将提取得到的特征输入分类器中进行分类后输出,得到花卉的分类结果;该方法采用花分类双线性金字塔网络,卷积层的特征与卷积层的特征融合,而不是直接通过网络输入最终的分类器。这些从特征金字塔中编码的特征自动携带多层次语义线索,对姿态和尺度的变化具有额外的鲁棒性,在分类识别方面优于单层特征。在基准数据集上进行了广泛的验证,以显示提出的方法的有效性。
-
公开(公告)号:CN119942076A
公开(公告)日:2025-05-06
申请号:CN202510012161.0
申请日:2025-01-03
Applicant: 桂林电子科技大学
IPC: G06V10/25 , G06V20/64 , G06V10/80 , G06V10/42 , G06V10/44 , G06V10/40 , G06V10/77 , G06V10/75 , G06V10/764 , G06N3/0464 , G06N3/045 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种基于全局特征增强与假阴性矫正的3D多目标检测方法,方法包括:首先从LiDAR传感器获取点云数据,并转换为规则体素网格,提取鸟瞰图(BEV)特征。设计滑动窗口注意力模块,结合自适应动态区域重定位裁剪,使每个区域的特征与其他区域进行交互,增强局部特征表征能力,促进全局上下文信息融合。具体实现包括区域划分、自适应动态区域重定位裁剪、区域自注意力以及滑动区域注意力机制的应用,以捕捉不同区域间的相互作用;构建并行的多阶段热图编码器,从BEV特征中解码中心热图并投影到BEV视图。热图峰值对应潜在目标位置,通过分析强度分布识别前k个最显著的目标特征,确保精确定位;同时引入累积伪阳性管理(APM)系统,在每层热图基础上生成掩码图,结合上层掩码图和当前热图更新检测结果,选择新的前k个最高峰值实例特征,减少误报和漏检,提高检测精度。最后通过多头自注意力以及局部交叉注意力机制强化实例在全局中的表征能力,最终优化BEV特征以预测3D边界框。
-
公开(公告)号:CN119380300A
公开(公告)日:2025-01-28
申请号:CN202411318112.1
申请日:2024-09-20
Applicant: 桂林电子科技大学
IPC: G06V20/56 , G06V20/40 , G06V10/25 , G06V10/44 , G06V10/80 , G06V10/77 , G06V10/764 , G06V10/75 , G06V10/82
Abstract: 本发明提供了一种基于Transformer的3D多目标检测与跟踪方法,涉及自动驾驶和三维目标检测与跟踪技术领域。该方法包括:从六个摄像头获取连续帧的RGB图像数据流;对图像数据中的物体进行检测与跟踪;设计特征提取网络,将RGB数据流映射到鸟瞰图BEV上,以便更好地感知车辆周围环境;设计4D Tubelet Query以动态表示数据流中所有的tubelets;设计时序自注意力机制,融合长短时序上BEV特征信息,以捕捉目标的时序动态性;设计交叉注意力机制,融合4D Tubelet Query和BEV视频流,以动态学习多物体的外貌特征、角度信息以及轨迹信息等进行相应的学习;设计任务头,将Transformer获取的Query特征通过FFN生成最终的物体检测框和轨迹信息。本发明采用上述的一种基于Transformer的3D多目标检测与跟踪方法,解决了现有方法在三维多目标检测与跟踪上TBD的不足,巧妙地将检测与跟踪耦合,实现高精度的目标检测与跟踪。
-
公开(公告)号:CN116563625A
公开(公告)日:2023-08-08
申请号:CN202310505919.5
申请日:2023-05-06
Applicant: 桂林电子科技大学
IPC: G06V10/764 , G06V10/774 , G06T7/00 , G06N20/20 , G06N3/0895
Abstract: 本发明公开了一种基于联邦学习和对比学习的医学图像分类方法,在联邦学习的训练中,将当前训练轮次的本地模型和上一轮次的全局模型与本地模型结合起来进行训练,减少本轮模型与上一轮全局模型特征表示之间的距离,增加本轮模型与上一轮本地模型特征表示之间的距离,运用模型之间的监督对比损失,让客户端的本地模型在训练过程中逐渐靠近全局模型。这种方法能有效地减轻数据异构性所带来的性能下降问题,增加模型的泛化能力。
-
公开(公告)号:CN119904860A
公开(公告)日:2025-04-29
申请号:CN202510040317.6
申请日:2025-01-10
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于三维点云的果实自动计数方法,涉及水果果实估产技术领域。该方法首先利用LIDAR相机捕获果园场景的点云序列数据及其对应的相机运动轨迹信息,并对三维场景进行俯瞰得到水果占用地图FOM;然后构建基于点云序列数据的高效物体检测模块,使用时空注意力引导的快速目标建议与状态初估计网络,基于早期集成阶段的FOM引导RPN以及中间集成阶段Fusion R‑CNN融合框架进行果实检测;最后基于AB3DMOT算法,构建基于点云序列数据的果实跟踪模块,进行时空记忆导向的运动预测和水果占用地图更新。本发明通过将物体状态随时间变化的累积记忆信息回灌至检测模块,显著提升了目标检测器检测3D目标时的精度和跟踪效率,实现了三维空间中物体持续定位、跟踪和识别。
-
公开(公告)号:CN118781189A
公开(公告)日:2024-10-15
申请号:CN202410903520.7
申请日:2024-07-08
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于多级3D高斯的密集RGB‑D SLAM方法,涉及三维场景重建和机器人自主导航领域。该方法包括:从RGB‑D相机获取连续的RGB图像和深度图数据流;对RGB‑D数据中的关键帧进行跟踪;设计多级高斯表示技术,将场景的几何和纹理细节分别用不同级别的高斯分布进行描述,并通过映射构建场景的三维地图;设计高斯渲染器对这些高斯分布进行渲染,生成RGB图像、深度图和可见性轮廓图;RGB‑D数据流与渲染结果作为输入反馈给系统的损失优化器,迭代优化多级高斯表示,最终重构出三维场景。本发明采用上述的一种基于多级3D高斯的密集RGB‑D SLAM方法,解决了现有方法在深度误差和渲染质量方面的不足,实现高精度的场景重建和导航。
-
-
-
-
-
-
-
-
-