一种面向复杂退化环境的多模复眼感知方法及装置

    公开(公告)号:CN119295892A

    公开(公告)日:2025-01-10

    申请号:CN202411201846.1

    申请日:2024-08-29

    Applicant: 同济大学

    Abstract: 本发明涉及计算机视觉领域,特别是指一种面向复杂退化环境的多模复眼感知方法及装置。所述方法包括:通过多模复眼采集设备获取复杂退化环境下的多组图像,输入到训练好的特征点预测模型提取得到可见光图像以及红外图像的关键特征点信息;根据最近邻匹配技术、可见光图像以及红外图像的关键特征点信息生成可见光拼接图像以及红外拼接图像,输入到构建好的多模感知检测网络进行目标检测,得到多模感知检测结果。本发明结合了深度学习算法、最近邻匹配技术和图像拼接技术,通过构建特征点预测模型和多模感知检测网络,实现了多模复眼传感器中可见光和红外两种模态的目标检测感知任务。

    一种低照度环境下隧道多病害多尺度分割方法及系统

    公开(公告)号:CN119048473A

    公开(公告)日:2024-11-29

    申请号:CN202411168427.2

    申请日:2024-08-23

    Applicant: 同济大学

    Abstract: 本发明涉及计算机视觉技术领域,特别涉及一种低照度环境下隧道多病害多尺度分割方法及系统。方法包括:构建平滑锐化模块,对输入图像进行降噪锐化处理;在EfficientNetV2上进行改进并将其作为主干网络对图片进行特征提取;在逐步下采样的过程中添加自适应图像增强S型曲线,自适应的对特征图暗部进行增强、降低高光部分;把特征图放入改进的金字塔池化模块进行多尺度的特征提取,每种尺度的特征图利用希尔伯特曲线降维后进行自注意力机制的计算获取图像中的空间信息;通过通道注意力来融合多尺度特征图并上采样至原图大小得到病害分割图。本发明通过设计自适应S增强曲线并添加进分割网络中,解决无人机在黑暗隧道中生成图像质量受限导致分割精度不高的问题。

    一种机器人视觉语言导航的动作自适应方法和系统

    公开(公告)号:CN118832572A

    公开(公告)日:2024-10-25

    申请号:CN202410784417.5

    申请日:2024-06-18

    Applicant: 同济大学

    Abstract: 本发明涉及一种机器人视觉语言导航的动作自适应方法和系统,包括:确定机器人可行动作空间数值范围,并生成随机动作;基于随机动作与环境交互所得变化,利用机器人动作影响自编码模块得到动作嵌入向量;基于动作嵌入向量,对比数据集中特定动作并计算差异,确定当前执行动作及对应的语义含义;基于确定性的动作与环境交互所得,利用交叉模态注意力特征提取模块,得到机器人视觉语言多模态特征;基于机器人视觉语言多模态特征,作为扩散策略决策模块条件,迭代推理出机器人下一步执行动作;对机器人状态进行更新,直至到达目标结束本次导航任务。与现有技术相比,本发明具有增强机器人动作自适应的鲁棒性和准确性等优点。

Patent Agency Ranking