-
公开(公告)号:CN115187959B
公开(公告)日:2023-04-14
申请号:CN202210833684.8
申请日:2022-07-14
Applicant: 清华大学
IPC: G06V20/58 , G06V20/17 , G06V20/70 , G06V10/26 , G06V10/82 , G06V10/764 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/08 , B60F5/02 , B64D45/04
Abstract: 本发明公开了一种基于双目视觉的飞行汽车着陆方法,基于部署在飞行汽车上的左右两摄像机实现,所述方法包括:步骤1)对飞行汽车降落过程中左右两摄像机拍摄的双目视图进行矫正,使得左右两摄像机的图像为平行视图;步骤2)根据矫正后的平行视图利用双目视觉获得对应的深度图;步骤3)将左摄像机捕获的图像输入预先建立和训练好的语义分割模型得到语义分割结果;步骤4)基于语义分割结果和图像的深度图,确定用于降落的候选区域;步骤5)根据确定的降落候选区域边界框,确定当前时刻的飞行汽车状态,结合深度图信息,发出控制信号控制飞行汽车降落;所述语义分割模型为改进后的DeepLab v3结构网络。
-
公开(公告)号:CN115187959A
公开(公告)日:2022-10-14
申请号:CN202210833684.8
申请日:2022-07-14
Applicant: 清华大学
IPC: G06V20/58 , G06V20/17 , G06V20/70 , G06V10/26 , G06V10/82 , G06V10/764 , G06N3/04 , B60F5/02 , B64D45/04
Abstract: 本发明公开了一种基于双目视觉的飞行汽车着陆方法,基于部署在飞行汽车上的左右两摄像机实现,所述方法包括:步骤1)对飞行汽车降落过程中左右两摄像机拍摄的双目视图进行矫正,使得左右两摄像机的图像为平行视图;步骤2)根据矫正后的平行视图利用双目视觉获得对应的深度图;步骤3)将左摄像机捕获的图像输入预先建立和训练好的语义分割模型得到语义分割结果;步骤4)基于语义分割结果和图像的深度图,确定用于降落的候选区域;步骤5)根据确定的降落候选区域边界框,确定当前时刻的飞行汽车状态,结合深度图信息,发出控制信号控制飞行汽车降落;所述语义分割模型为改进后的DeepLab v3结构网络。
-
公开(公告)号:CN118570800A
公开(公告)日:2024-08-30
申请号:CN202410710040.9
申请日:2024-06-03
Applicant: 清华大学天津电子信息研究院 , 惠然科技有限公司 , 中国航发四川燃气涡轮研究院
Abstract: 本申请公开了一种用于扫描电子显微镜定位拍摄的方法、设备及存储介质。所述方法包括:获取初始拍摄采集的原始扫描电镜图像;将所述原始扫描电镜图像输入至训练好的分割模型进行掩码分割操作,以获得掩码分割结果;基于所述掩码分割结果提取图像的特征信息;以及根据所述特征信息计算二次拍摄所需的目标电镜参数,以用于扫描电子显微镜定位拍摄。利用本申请的方案,可以减少手工干预,减少二次拍摄时间,提升拍摄效率。
-
公开(公告)号:CN114782865B
公开(公告)日:2023-04-14
申请号:CN202210413332.7
申请日:2022-04-20
Applicant: 清华大学
Abstract: 本发明公开了一种基于多视角和重识别的路口车辆定位方法及系统,基于路侧设备部署的多视角相机实现,所述方法包括:对多视角相机采集的路口原始图像进行预处理;对预处理后的视角图像依次进行特征提取、透视变换和聚合,生成路口车辆的分布鸟瞰图;将路口原始图像输入预先建立和训练好的车辆检测模型,得到路口车辆的搜索域;接收路口的车辆发送的环视图片和id信息,在搜索域中重识别该车辆,得到该车辆的某一视角图片;对重识别得到的某一视角图像进行特征提取和透视变换,并投影到鸟瞰图中,得到车辆在鸟瞰图中的位置信息;将位置信息及该车辆的id信息发送至该车辆,从而完成定位。
-
公开(公告)号:CN115035296A
公开(公告)日:2022-09-09
申请号:CN202210680819.1
申请日:2022-06-15
Applicant: 清华大学
Abstract: 本发明公开了一种基于鸟瞰投影的飞行汽车3D语义分割方法及系统,该方法包括:步骤1)对飞行汽车采集的不定尺寸大规模3D点云数据进行给定尺寸裁剪;步骤2)通过设定比例因子、窗格尺寸和步距,经缩小、滑窗法和正则化处理得到若干个窗格,每个窗格包括若干个网格,分别对每个网格的点云数据进行投影,得到每个窗格的RGB图像和Alt深度投影图;步骤3)将每个窗格的RGB图像和Alt深度投影图输入预先建立和训练好的2D图像语义分割模型,得到2D语义分割结果;步骤4)将2D语义分割结果,映射到3D点云数据上,得到3D语义分割结果;2D图像语义分割模型基于自注意力机制的多模型融合方法实现。
-
公开(公告)号:CN115035296B
公开(公告)日:2024-07-12
申请号:CN202210680819.1
申请日:2022-06-15
Applicant: 清华大学
IPC: G06V10/26 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于鸟瞰投影的飞行汽车3D语义分割方法及系统,该方法包括:步骤1)对飞行汽车采集的不定尺寸大规模3D点云数据进行给定尺寸裁剪;步骤2)通过设定比例因子、窗格尺寸和步距,经缩小、滑窗法和正则化处理得到若干个窗格,每个窗格包括若干个网格,分别对每个网格的点云数据进行投影,得到每个窗格的RGB图像和Alt深度投影图;步骤3)将每个窗格的RGB图像和Alt深度投影图输入预先建立和训练好的2D图像语义分割模型,得到2D语义分割结果;步骤4)将2D语义分割结果,映射到3D点云数据上,得到3D语义分割结果;2D图像语义分割模型基于自注意力机制的多模型融合方法实现。
-
公开(公告)号:CN114782865A
公开(公告)日:2022-07-22
申请号:CN202210413332.7
申请日:2022-04-20
Applicant: 清华大学
Abstract: 本发明公开了一种基于多视角和重识别的路口车辆定位方法及系统,基于路侧设备部署的多视角相机实现,所述方法包括:对多视角相机采集的路口原始图像进行预处理;对预处理后的视角图像依次进行特征提取、透视变换和聚合,生成路口车辆的分布鸟瞰图;将路口原始图像输入预先建立和训练好的车辆检测模型,得到路口车辆的搜索域;接收路口的车辆发送的环视图片和id信息,在搜索域中重识别该车辆,得到该车辆的某一视角图片;对重识别得到的某一视角图像进行特征提取和透视变换,并投影到鸟瞰图中,得到车辆在鸟瞰图中的位置信息;将位置信息及该车辆的id信息发送至该车辆,从而完成定位。
-
-
-
-
-
-