基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法

    公开(公告)号:CN111897224A

    公开(公告)日:2020-11-06

    申请号:CN202010811359.2

    申请日:2020-08-13

    Applicant: 福州大学

    Abstract: 本发明提出一种基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法,将最优控制方法引入多机器人系统领航跟随者编队控制方法中,利用模糊逻辑系统逼近连续函数的能力,解决最优控制中汉密尔顿-雅可比-贝尔曼方程难以求取解析解的问题;同时,结合演员-评论家强化学习算法,形成演员模糊逻辑系统模块和评论家模糊逻辑系统模块,前者执行控制行为,后者对前者所选择的行为进行评价并将评价信息反馈给前者。该方法可以平衡控制性能和资源损耗,并且以在线学习的方式提高多机器人系统对于环境的适应性。

    一种多智能体系统零空间行为控制动态任务优先级规划方法

    公开(公告)号:CN111882184A

    公开(公告)日:2020-11-03

    申请号:CN202010677791.7

    申请日:2020-07-14

    Applicant: 福州大学

    Abstract: 本发明涉及一种多智能体系统零空间行为控制动态任务优先级规划方法,首先,通过零空间投影的方法,建立复合任务;其次,将动态任务优先级规划问题转化为一个切换模式最优控制问题;最后应用混合整数优化方法,求解该最优控制问题得到最优复合任务轨迹。此方法解决多智能体系统零空间行为控制动态任务优先级规划问题,该方法不需要人为的设定任务优先级的切换条件,从而减少了研究人员的工作量,并具有良好的可扩展性,能被应用于传统逻辑法难以处理的大数量任务优先级动态规划中。此外,该方法在任务优先级切换的过程中考虑了对智能体未来状态的预测信息,使得其相较于传统的逻辑方法具有更加理想的切换效果。

    一种基于人在回路的多机器人系统的决策建模与协同控制方法及系统

    公开(公告)号:CN111596691A

    公开(公告)日:2020-08-28

    申请号:CN202010648652.1

    申请日:2020-07-07

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于人在回路的多机器人系统的决策建模与协同控制方法及系统,包括步骤:获取机器人执行任务后的输出信息值,选择机器人位置偏差信息作为人的决策信息;使用人的漂移扩散模型作为建模方法,根据人的决策信息对人的决策行为进行建模;设计人为决策任务,在机器人无法依赖自主控制系统完成任务的时候,执行人为决策任务,帮助机器人顺利完成任务。本发明将漂移扩散模型与基于零空间的行为控制方法相结合,提出人的漂扩散模型,通过速度-准确性准则得到相对应的决策阈值公式,该方法能够提高人的决策准确性。

    一种基于人在回路的多机器人系统的决策建模与协同控制方法及系统

    公开(公告)号:CN111596691B

    公开(公告)日:2021-08-31

    申请号:CN202010648652.1

    申请日:2020-07-07

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于人在回路的多机器人系统的决策建模与协同控制方法及系统,包括步骤:获取机器人执行任务后的输出信息值,选择机器人位置偏差信息作为人的决策信息;使用人的漂移扩散模型作为建模方法,根据人的决策信息对人的决策行为进行建模;设计人为决策任务,在机器人无法依赖自主控制系统完成任务的时候,执行人为决策任务,帮助机器人顺利完成任务。本发明将漂移扩散模型与基于零空间的行为控制方法相结合,提出人的漂扩散模型,通过速度‑准确性准则得到相对应的决策阈值公式,该方法能够提高人的决策准确性。

    多智能体系统零空间行为控制动态任务优先级规划方法

    公开(公告)号:CN111882184B

    公开(公告)日:2022-10-14

    申请号:CN202010677791.7

    申请日:2020-07-14

    Applicant: 福州大学

    Abstract: 本发明涉及一种多智能体系统零空间行为控制动态任务优先级规划方法,首先,通过零空间投影的方法,建立复合任务;其次,将动态任务优先级规划问题转化为一个切换模式最优控制问题;最后应用混合整数优化方法,求解该最优控制问题得到最优复合任务轨迹。此方法解决多智能体系统零空间行为控制动态任务优先级规划问题,该方法不需要人为的设定任务优先级的切换条件,从而减少了研究人员的工作量,并具有良好的可扩展性,能被应用于传统逻辑法难以处理的大数量任务优先级动态规划中。此外,该方法在任务优先级切换的过程中考虑了对智能体未来状态的预测信息,使得其相较于传统的逻辑方法具有更加理想的切换效果。

    基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法

    公开(公告)号:CN111897224B

    公开(公告)日:2022-04-01

    申请号:CN202010811359.2

    申请日:2020-08-13

    Applicant: 福州大学

    Abstract: 本发明提出一种基于演员‑评论家强化学习和模糊逻辑的多智能体编队控制方法,将最优控制方法引入多机器人系统领航跟随者编队控制方法中,利用模糊逻辑系统逼近连续函数的能力,解决最优控制中汉密尔顿‑雅可比‑贝尔曼方程难以求取解析解的问题;同时,结合演员‑评论家强化学习算法,形成演员模糊逻辑系统模块和评论家模糊逻辑系统模块,前者执行控制行为,后者对前者所选择的行为进行评价并将评价信息反馈给前者。该方法可以平衡控制性能和资源损耗,并且以在线学习的方式提高多机器人系统对于环境的适应性。

Patent Agency Ranking