一种基于可学习的特征图过滤与图注意力网络的视觉场景识别方法

    公开(公告)号:CN113033669B

    公开(公告)日:2024-05-14

    申请号:CN202110331476.3

    申请日:2021-03-29

    Applicant: 东北大学

    Abstract: 一种基于可学习的特征图过滤与图注意力网络的视觉场景识别方法,包括如下步骤:对每帧输入图像进行基础网络的稠密特征提取,利用池化方式生成二通道描述符。然后利用全连接层与激活函数的结构生成新的通道权重,并与原始输入的卷积特征进行重新尺度化操作,生成过滤特征。随后针对过滤后的特征图,建立完全图模型,通过信息生成网络输出每个节点的影响力信息,并以非线性组合的方式,实现节点特征的更新。最后通过子认证网络,促使同一地点的图像特征映射至相同的特征空间,并利用余弦距离计算优化特征间的相似度,实现视觉场景识别。极大地提升了机器人在大尺度场景下的视觉定位准确性,有助于开展更智能化的视觉导航等工作。

    一种基于可学习的特征图过滤与图注意力网络的视觉场景识别方法

    公开(公告)号:CN113033669A

    公开(公告)日:2021-06-25

    申请号:CN202110331476.3

    申请日:2021-03-29

    Applicant: 东北大学

    Abstract: 一种基于可学习的特征图过滤与图注意力网络的视觉场景识别方法,包括如下步骤:对每帧输入图像进行基础网络的稠密特征提取,利用池化方式生成二通道描述符。然后利用全连接层与激活函数的结构生成新的通道权重,并与原始输入的卷积特征进行重新尺度化操作,生成过滤特征。随后针对过滤后的特征图,建立完全图模型,通过信息生成网络输出每个节点的影响力信息,并以非线性组合的方式,实现节点特征的更新。最后通过子认证网络,促使同一地点的图像特征映射至相同的特征空间,并利用余弦距离计算优化特征间的相似度,实现视觉场景识别。极大地提升了机器人在大尺度场景下的视觉定位准确性,有助于开展更智能化的视觉导航等工作。

    基于二次曲面初始化和联合数据关联的物体感知SLAM算法

    公开(公告)号:CN115239809A

    公开(公告)日:2022-10-25

    申请号:CN202210813501.6

    申请日:2022-07-11

    Applicant: 东北大学

    Abstract: 本发明属于物体感知算法领域,提出了一种基于二次曲面初始化和联合数据关联的物体感知SLAM算法。首先提取图像中的特征点、平面和物体信息;然后根据特征点和平面信息计算相机位姿;然后对图像的物体信息和地图中的物体信息进行联合数据关联,进而完成物体二次曲面参数的高效初始化;然后联合优化相机位姿和地图中构建的物体二次曲面,最终构建出完整的几何语义地图;本发明提出的方法解决了以往二次曲面级SLAM算法中存在的二次曲面初始化困难、数据关联不鲁棒等问题;提高了物体建模精度和相机定位精度。

    一种基于体素地图面元约束的跨模态视觉定位方法

    公开(公告)号:CN118314305A

    公开(公告)日:2024-07-09

    申请号:CN202410424960.4

    申请日:2024-04-10

    Applicant: 东北大学

    Abstract: 本发明提供了一种基于体素地图面元约束的跨模态视觉定位方法,涉及视觉定位及视觉SLAM领域,本方法通过离线优化雷达帧位姿,构建第一体素地图,体素地图至少包括面元信息。基于视觉里程计,计算图像帧位姿,得到视觉3D地图点,对视觉3D地图点和所述图像帧位姿使用重投影误差优化,得到初始位姿;根据当前图像帧位置,使用子地图索引和哈希表中的体素动态加载子地图;根据所述初始位姿,通过跨模态数据关联所述第一体素地图和所述视觉3D地图点,构建第一约束,实现视觉定位位姿优化。本发明通过跨模态视觉定位,抑制自动驾驶长距离行驶的累积漂移问题,实现了持续性的实时高精度定位,有助于后续开展导航规划等任务。

    基于鲁棒的二次曲面初始化的室外视觉定位和建图方法

    公开(公告)号:CN116630561A

    公开(公告)日:2023-08-22

    申请号:CN202310603931.X

    申请日:2023-05-26

    Applicant: 东北大学

    Abstract: 本发明提供一种基于鲁棒的二次曲面初始化的室外视觉定位和建图方法,涉及视觉SLAM技术领域。本发明首先通过二维观测对目标物体初始化为等轴球体,然后利用后续观测优化球体为椭球。系统使用基于语义特征、椭球投影交并比和物体运动预测的数据关联算法保证连续帧物体的准确关联。最后使用联合优化策略,对相机位姿,二次曲面参数,地图点优化,最终构建完整的物体级语义地图。该发明能克服物体检测噪声和动态遮挡的干扰,并能有效克服传统物体初始化算法对平面假设的依赖,以适应复杂的实际场景路况,应用于无人驾驶和智能机器人的视觉感知和视觉定位领域。

    一种基于先验语义地图结构信息和语义信息的视觉定位方法

    公开(公告)号:CN114972501B

    公开(公告)日:2024-07-02

    申请号:CN202210423500.0

    申请日:2022-04-21

    Applicant: 东北大学

    Abstract: 本发明属于视觉SLAM领域,提出了一种基于先验语义地图结构信息和语义信息的视觉定位方法。本发明通过一种融合先验语义地图语义信息和结构信息的混合约束,将先验语义地图因子引入到视觉定位中。随后,利用视觉路标与先验语义地图之间的数据关联,使用期望最大化算法同时优化数据关联和相机位姿,提高视觉定位的精度和鲁棒性。该算法能够有效限制视觉里程计的漂移误差并提高视觉定位精度,以服务于导航等应用场景。在满足实时性的要求下,取得了较高的定位精度。

    一种多尺度特征融合的大规模点云场景重识别方法

    公开(公告)号:CN117636142A

    公开(公告)日:2024-03-01

    申请号:CN202311546337.8

    申请日:2023-11-20

    Applicant: 东北大学

    Abstract: 本发明属于场景重识别领域,公开了一种多尺度特征融合的大规模点云场景重识别方法。将点云序列进行静态点云生成处理,滤除场景中的近景动态物体并得到纯净的静态点云;将纯净的静态点云输入至描述符编码网络中,得到点云全局描述符并构建数据库;在查询过程中,采用最近邻算法找到数据库中最相似的点云。本发明实现了点云场景重识别在计算效率和准确性方面的平衡。静态点云生成方法以去除动态物体的遮挡影响,得到连续帧的拼接静态点云。点云描述符编码网络包含空间变换模块、多尺度特征融合模块、CapsNet模块和GeM池化层。本发明凭借其计算高效性、高准确率和鲁棒性可以有效用于实时点云全局定位任务。

    一种基于先验语义地图结构信息和语义信息的视觉定位算法

    公开(公告)号:CN114972501A

    公开(公告)日:2022-08-30

    申请号:CN202210423500.0

    申请日:2022-04-21

    Applicant: 东北大学

    Abstract: 本发明属于视觉SLAM领域,提出了一种基于先验语义地图结构信息和语义信息的视觉定位算法。本发明通过一种融合先验语义地图语义信息和结构信息的混合约束,将先验语义地图因子引入到视觉定位中。随后,利用视觉路标与先验语义地图之间的数据关联,使用期望最大化算法同时优化数据关联和相机位姿,提高视觉定位的精度和鲁棒性。该算法能够有效限制视觉里程计的漂移误差并提高视觉定位精度,以服务于导航等应用场景。在满足实时性的要求下,取得了较高的定位精度。

Patent Agency Ranking