基于注意力机制的多模态三维目标检测方法

    公开(公告)号:CN119810816A

    公开(公告)日:2025-04-11

    申请号:CN202411890586.3

    申请日:2024-12-20

    Applicant: 郑州大学

    Abstract: 本发明提供了一种基于注意力机制的多模态三维目标检测方法,该方法包括:获取图像数据及LiDAR点云数据,并对其进行预处理,对处理后的图像数据及LiDAR点云数据进行特征提取,基于双向信息交互的多模态特征融合算法对提取的图像特征及点云特征进行融合,对融合后的特征进行优化,消除冗余和噪声,同时,在特定的感兴趣区域内,对融合特征进行精细化处理,将融合及优化后的特征输入目标检测模块,通过候选框生成、分类和回归任务,完成多模态三维目标的分类、定位和识别,基于非极大抑制算法,去除冗余的检测框,输出检测结果,包括目标的类别标签、边界框坐标以及置信度分数。本发明提升了多模态融合的效率和检测精度,便于使用。

    基于智能体交互与环境上下文交互的行人轨迹预测方法

    公开(公告)号:CN119888607A

    公开(公告)日:2025-04-25

    申请号:CN202411936431.9

    申请日:2024-12-26

    Applicant: 郑州大学

    Abstract: 本发明提供了一种基于智能体交互与环境上下文交互的行人轨迹预测方法,该方法包括:获取行人轨迹数据集,构建行人轨迹预测模型(M2Tames),其中,行人轨迹预测模型包括编码器、改进的交互模块(IM)及解码器,基于行人轨迹数据集对行人轨迹预测模型进行训练,基于训练后的行人轨迹预测模型进行行人轨迹预测。本发明通过精确捕捉行人的历史轨迹特征和智能体之间的潜在交互关系,不仅在预测准确性上表现出色,还具备高度的适应性,能够在动态变化的环境中有效运作,有望在智能交通管理、公共安全监控、以及自动驾驶等领域得到广泛应用,为实时决策提供可靠的支持。

Patent Agency Ranking