一种基于多模态强化学习算法的倒水服务机器人控制方法

    公开(公告)号:CN117162090A

    公开(公告)日:2023-12-05

    申请号:CN202311184535.4

    申请日:2023-09-14

    Applicant: 同济大学

    Inventor: 尤鸣宇 苏志成

    Abstract: 本发明公开了一种基于多模态强化学习算法的倒水服务机器人控制方法,该方法使用文字、声音和单目RGB图像作为输入,为机器人提供丰富的多模态信息,采用神经网络对多模态信息进行表征、对齐、修正和融合,使机器人能利用强化学习算法快速自学习地完成服务倒水任务,解决了现实生活场景下使用强化学习训练机器人完成倒水任务的以下问题:费时费力且训练过程不稳定、训练模型不健壮、任务完成度不高。并发明可以更加快速地使机器人自学习地学会完成倒水任务,并且更加准确地执行倒水动作。

    一种基于动态模型强化学习的倒水服务机器人控制方法

    公开(公告)号:CN113031437B

    公开(公告)日:2022-10-25

    申请号:CN202110217090.X

    申请日:2021-02-26

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于动态模型强化学习的倒水服务机器人控制方法,包括:步骤1:基于深度相机获取三维空间的视觉信息;步骤2:利用深度神经网络完成对机器人、源容器和目标容器的识别,同时获得源容器、目标容器之间的相对位置信息、液体类型以及液位高度信息,完成状态信息的获取;步骤3:根据步骤2获取的信息建立动态模型模拟当前环境,并利用动态模型对策略网络进行训练;步骤4:待策略网络收敛后,将机器人的位姿信息和状态信息输入至策略网络,输出机器人动作策略;步骤5:使用步骤4预测出的机器人动作策略驱动机器人完成倒水动作。与现有技术相比,本发明具有对环境的泛化适应能力强、部署复杂度低等优点。

    一种基于动态模型强化学习的倒水服务机器人控制方法

    公开(公告)号:CN113031437A

    公开(公告)日:2021-06-25

    申请号:CN202110217090.X

    申请日:2021-02-26

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于动态模型强化学习的倒水服务机器人控制方法,包括:步骤1:基于深度相机获取三维空间的视觉信息;步骤2:利用深度神经网络完成对机器人、源容器和目标容器的识别,同时获得源容器、目标容器之间的相对位置信息、液体类型以及液位高度信息,完成状态信息的获取;步骤3:根据步骤2获取的信息建立动态模型模拟当前环境,并利用动态模型对策略网络进行训练;步骤4:待策略网络收敛后,将机器人的位姿信息和状态信息输入至策略网络,输出机器人动作策略;步骤5:使用步骤4预测出的机器人动作策略驱动机器人完成倒水动作。与现有技术相比,本发明具有对环境的泛化适应能力强、部署复杂度低等优点。

Patent Agency Ranking