一种基于可解释强化学习的多智能体运动控制方法

    公开(公告)号:CN118689094A

    公开(公告)日:2024-09-24

    申请号:CN202410551237.2

    申请日:2024-05-07

    Abstract: 本发明公开的一种基于可解释强化学习的多智能体运动控制方法,属于无人系统运动控制领域。本发明实现方法为:构建多智能体运动控制系统并定义其状态空间和动作空间;基于胶囊网络结构构建具备可解释性的决策网络,基于决策网络将任意时刻智能体的状态数据作为输入,计算输出动作空间中动作的对应胶囊向量;构建保留可解释性的转换器将胶囊向量转换为动作价值;构建基于胶囊结构的MADDPG强化学习模型,解决无人系统运动控制领域中具备可解释性的强化学习模型设计问题;构建基于胶囊结构的强化学习模型中胶囊激活状态展示模块,以表征网络对多智能体运动控制的可解释性。本发明具有控制精度高、模型轻量化、可解释性强等优点。

    一种快速逃逸者协同围捕方法
    2.
    发明公开

    公开(公告)号:CN117389140A

    公开(公告)日:2024-01-12

    申请号:CN202311304908.7

    申请日:2023-10-10

    Abstract: 本发明公开的一种快速逃逸者协同围捕方法,属于多智能体协同控制领域。本发明实现方法为:根据逃逸者的状态观测信息和追捕者自身的状态信息确定相对方位角,对追捕者进行任务分配和通信拓扑变换,将追捕者划分为一个猎手和两组包围者;基于追逃双方的速度比和平行制导律,为猎手制定猎手追捕策略,使猎手快速靠近逃逸者同时尽量保持与逃逸者的方位角不变;根据逃逸者和相邻追捕者的状态信息,为包围者制定包围者追捕策略,尽可能保证相邻追捕者的阿波罗尼斯圆之间不产生逃逸间隙同时缩小与逃逸者之间的距离,并平衡二者之间的关系;基于猎手追捕策略和包围者追捕策略实现对快速逃逸者的协同围捕。本发明提高对快速逃逸者围捕的成功率和围捕效率。

Patent Agency Ranking