-
公开(公告)号:CN113156954B
公开(公告)日:2023-03-24
申请号:CN202110447666.1
申请日:2021-04-25
Applicant: 电子科技大学
IPC: G05D1/02
Abstract: 本发明公开了一种基于增强学习的多智能体集群避障方法,包括以下步骤:S1.建立集群系统的运动模型;S2.定义避障因子ξ及避障评价准则;S3.设计ξ<ξmin时集群队形变换避障模型Q‑learning训练的状态空间、行为空间和奖励函数;S4.设计时集群自主协同避障模型增强学习训练的状态空间、行为空间和奖励函数;S5:设计智能体行为选择方法;S6.获取训练得到的Q值表,基于S1中定义的运动模型进行集群自主协同避障。本发明根据避障因子、避障评价准则等参数用于智能体集群避障模型选择判断,并结合Q‑learning算法将集群自主协同避障模型进行训练,得到最优的集群个体避障策略和高避障效率。
-
公开(公告)号:CN113156954A
公开(公告)日:2021-07-23
申请号:CN202110447666.1
申请日:2021-04-25
Applicant: 电子科技大学
IPC: G05D1/02
Abstract: 本发明公开了一种基于增强学习的多智能体集群避障方法,包括以下步骤:S1.建立集群系统的运动模型;S2.定义避障因子ξ及避障评价准则;S3.设计ξ<ξmin时集群队形变换避障模型Q‑learning训练的状态空间、行为空间和奖励函数;S4.设计时集群自主协同避障模型增强学习训练的状态空间、行为空间和奖励函数;S5:设计智能体行为选择方法;S6.获取训练得到的Q值表,基于S1中定义的运动模型进行集群自主协同避障。本发明根据避障因子、避障评价准则等参数用于智能体集群避障模型选择判断,并结合Q‑learning算法将集群自主协同避障模型进行训练,得到最优的集群个体避障策略和高避障效率。
-
公开(公告)号:CN111880565A
公开(公告)日:2020-11-03
申请号:CN202010710580.9
申请日:2020-07-22
Applicant: 电子科技大学
IPC: G05D1/10
Abstract: 本发明公开了一种基于Q-Learning的集群协同对抗方法,包括以下步骤:给出集群中智能体的动力学系统;确定集群中智能体的邻居集合;给定两个互相抗衡关系的集群的运动过程;在Flocking算法中计算控制力;确定避障方式;选择避障方式,定义集群之间的距离;确定集群速度;设计相对极坐标;设计协同驱赶的状态空间;设计集群的行为空间;设计奖罚机制;对于Q-learning学习算法,给定其Q值表更新函数。本发明借助Q-Learning技术去训练和学习集群控制算法,有效提高集群运行效率,使利益达到最大化,并能够保证集群的稳定性。
-
公开(公告)号:CN111880564A
公开(公告)日:2020-11-03
申请号:CN202010710554.6
申请日:2020-07-22
Applicant: 电子科技大学
IPC: G05D1/10
Abstract: 本发明公开了一种基于协同增强学习的多智能体区域搜索方法,包括以下步骤:S1.建立集群系统的运动模型;S2.定义γ信息地图及集群信息地图融合方式;S3.定义增强学习训练所需要的状态空间和行为空间;S4.根据状态空间和行为空间定义交互增强学习训练方法;S5.获取训练得到的Q值表,根据运动模型进行区域搜索,并根据Q值表确定下一时刻的位置。本发明实现了邻居的学习经验的共享,并且在共享的过程中,通过筛选的方式滤除无用的经验,在提高学习效率的同时,大大降低了智能体之间的通信量。
-
-
-