-
公开(公告)号:CN118393880A
公开(公告)日:2024-07-26
申请号:CN202410479873.9
申请日:2024-04-22
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G05B13/04
Abstract: 本发明涉及多智能体系统、人工智能领域,公开了一种基于多智能体强化学习的可扩展性集群控制方法,包括以下步骤:建立多智能体集群运动控制模型;设计智能体的观测状态空间、动作空间、奖励函数;设计智能体Actor网络与基于注意力机制的Critic网络模型;设计算法框架以及网络更新方法;设计集群控制算法的训练流程;本发明利用多智能体深度强化学习技术在复杂环境中实现集群协同控制算法,利用注意力机制提取智能体之间的关键的状态信息,从复杂的全局信息中有选择性的聚焦于局部状态特征提升模型的适应性和泛化能力,使得算法能从小规模的训练中迁移到更大规模的任务,有效的应对更加复杂多变的环境。