基于强化学习的机器人一体化网络架构优化方法及系统

    公开(公告)号:CN114610037B

    公开(公告)日:2025-05-23

    申请号:CN202210254462.0

    申请日:2022-03-15

    Abstract: 本发明提供了一种基于强化学习的机器人一体化网络架构优化方法及系统,首先基于多模传感器在一个由浅入深的分层式网络中进行不同程度的环境抽象特征提取;然后以上述分层式网络为主干,根据移动机器人的定位、规划、目标识别和博弈决策等方面的需求,在不同抽象层位置设计分支网络进行一体化网络实现;最后采用多目标联合的融合优化对前述一体化网络进行迭代优化,使得机器人输出合理移动和博弈策略。本发明提出的一种主干特征分层抽取、多任务分支式设计的一体化网络结构及其优化方法,解决了现有移动机器人各功能模块松耦合和分离研究的问题,提升了网络运行效率和数据利用率,减少了模块间冗余和耦合调试成本,有利于实际应用。

    基于强化学习的机器人一体化网络架构优化方法及系统

    公开(公告)号:CN114610037A

    公开(公告)日:2022-06-10

    申请号:CN202210254462.0

    申请日:2022-03-15

    Abstract: 本发明提供了一种基于强化学习的机器人一体化网络架构优化方法及系统,首先基于多模传感器在一个由浅入深的分层式网络中进行不同程度的环境抽象特征提取;然后以上述分层式网络为主干,根据移动机器人的定位、规划、目标识别和博弈决策等方面的需求,在不同抽象层位置设计分支网络进行一体化网络实现;最后采用多目标联合的融合优化对前述一体化网络进行迭代优化,使得机器人输出合理移动和博弈策略。本发明提出的一种主干特征分层抽取、多任务分支式设计的一体化网络结构及其优化方法,解决了现有移动机器人各功能模块松耦合和分离研究的问题,提升了网络运行效率和数据利用率,减少了模块间冗余和耦合调试成本,有利于实际应用。

    基于外部记忆的机器人导航方法及系统

    公开(公告)号:CN115170666A

    公开(公告)日:2022-10-11

    申请号:CN202210833085.6

    申请日:2022-07-15

    Abstract: 本发明提供了一种基于外部记忆的机器人导航方法及系统,包括:里程计位姿估计模块输入相邻两帧RGB图像,处理后得到多尺寸特征图,进行互卷积操作,并经过更深网络层处理获得机器人位姿估计;将位姿作为输入,并写入外部记忆池,同时从记忆池中读取包含机器人运动轨迹信息的特征向量;利用特征向量输出运动策略,控制机器人运动;对里程计位姿估计网络进行预训练,构建一体化网络优化策略,对各模块进行监督学习和强化学习联合优化。本发明将外部内存资源与神经网络耦合,并将传统对环境特征的记忆改进为对历史位姿序列的记忆,避免了冗余环境特征带来的计算存储资源开销,增大了网络的记忆容量,扩展了神经网络的功能。

Patent Agency Ranking