-
公开(公告)号:CN117268385A
公开(公告)日:2023-12-22
申请号:CN202310869868.4
申请日:2023-07-17
Applicant: 西北工业大学
IPC: G01C21/20
Abstract: 本发明公开了一种基于最优策略回放的室内机器人视觉导航方法,分为on‑policy算法和off‑policy算法,通过在on‑policy中训练当前导航目标,在off‑policy中回顾旧导航目标来减少灾难性遗忘。该方法一个单特征提取网络和一个策略网络。策略网络的输入是状态特征提取网络的输出,即当前图像的高级特征图。整个网络的输出是两个函数:策略函数π(a|s)和价值函数Q(s|a)。整个训练过程分为两个阶段:on‑policy阶段和off‑policy阶段。在on‑policy阶段,代理通过与环境的交互学习新目标的策略,而在off‑policy阶段,代理使用存储在memory中的旧目标的最优经验来回顾已学习的策略,来防止灾难性遗忘。本发明度的利用了memory中的经验来学习旧导航目标的经验,可以最大限度的减少遗忘。
-
公开(公告)号:CN117685950A
公开(公告)日:2024-03-12
申请号:CN202311596627.3
申请日:2023-11-28
Applicant: 西北工业大学
IPC: G01C21/00 , G01C21/20 , G06V10/25 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/092 , G06V10/74
Abstract: 本发明公开了一种基于类无关网络的零样本室内机器人视觉导航方法(CIRN),不使用原始视觉信息作为强化学习的状态,而是将当前视觉下的目标检测信息作为状态,利用对象和导航目标之间的相对语义相似度来表示不同的对象,根据多个对象的相对语义相似度对它们的信息进行降序排序。与状态矩阵中预设的对象类别数量和类别的固定位置相比,本发明方法可以应用于所有场景,无论具体的类别如何。
-