基于数字孪生和强化学习的多智能体协同避碰采摘方法

    公开(公告)号:CN114942633B

    公开(公告)日:2025-01-10

    申请号:CN202210457714.X

    申请日:2022-04-28

    Abstract: 本发明公开了一种基于数字孪生和深度强化学习的多智能体协同避碰采摘方法,包括建立数字果园数据库,构建孪生果园场景;基于马尔可夫决策过程框架对虚拟机器人自主避碰采摘策略问题进行环境建模并搭建仿真系统,设定状态空间和动作空间;基于人工势场法设计奖励函数,结合多智能体分布式近端策略优化算法建立APF‑MADPPO学习模型;建立APF‑MADPPO网络模型及训练流程,设置训练方法;基于迁移学习、推理学习,规划出最优采摘路径,通过控制指令驱动真实机器人在错综复杂的环境下完成自动避碰采摘任务。本发明可以实现在实时变化环境下,多智能体能够协同作业且自主避碰,进而完成自动采摘任务。

    基于数字孪生和强化学习的多智能体协同避碰采摘方法

    公开(公告)号:CN114942633A

    公开(公告)日:2022-08-26

    申请号:CN202210457714.X

    申请日:2022-04-28

    Abstract: 本发明公开了一种基于数字孪生和深度强化学习的多智能体协同避碰采摘方法,包括建立数字果园数据库,构建孪生果园场景;基于马尔可夫决策过程框架对虚拟机器人自主避碰采摘策略问题进行环境建模并搭建仿真系统,设定状态空间和动作空间;基于人工势场法设计奖励函数,结合多智能体分布式近端策略优化算法建立APF‑MADPPO学习模型;建立APF‑MADPPO网络模型及训练流程,设置训练方法;基于迁移学习、推理学习,规划出最优采摘路径,通过控制指令驱动真实机器人在错综复杂的环境下完成自动避碰采摘任务。本发明可以实现在实时变化环境下,多智能体能够协同作业且自主避碰,进而完成自动采摘任务。

Patent Agency Ranking