基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法

    公开(公告)号:CN111897224B

    公开(公告)日:2022-04-01

    申请号:CN202010811359.2

    申请日:2020-08-13

    Applicant: 福州大学

    Abstract: 本发明提出一种基于演员‑评论家强化学习和模糊逻辑的多智能体编队控制方法,将最优控制方法引入多机器人系统领航跟随者编队控制方法中,利用模糊逻辑系统逼近连续函数的能力,解决最优控制中汉密尔顿‑雅可比‑贝尔曼方程难以求取解析解的问题;同时,结合演员‑评论家强化学习算法,形成演员模糊逻辑系统模块和评论家模糊逻辑系统模块,前者执行控制行为,后者对前者所选择的行为进行评价并将评价信息反馈给前者。该方法可以平衡控制性能和资源损耗,并且以在线学习的方式提高多机器人系统对于环境的适应性。

    基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法

    公开(公告)号:CN111897224A

    公开(公告)日:2020-11-06

    申请号:CN202010811359.2

    申请日:2020-08-13

    Applicant: 福州大学

    Abstract: 本发明提出一种基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法,将最优控制方法引入多机器人系统领航跟随者编队控制方法中,利用模糊逻辑系统逼近连续函数的能力,解决最优控制中汉密尔顿-雅可比-贝尔曼方程难以求取解析解的问题;同时,结合演员-评论家强化学习算法,形成演员模糊逻辑系统模块和评论家模糊逻辑系统模块,前者执行控制行为,后者对前者所选择的行为进行评价并将评价信息反馈给前者。该方法可以平衡控制性能和资源损耗,并且以在线学习的方式提高多机器人系统对于环境的适应性。

Patent Agency Ranking