-
公开(公告)号:CN115542777A
公开(公告)日:2022-12-30
申请号:CN202211327589.7
申请日:2022-10-27
Applicant: 北京计算机技术及应用研究所
IPC: G05B17/02
Abstract: 本发明涉及一种针对异构多智能体仿真对抗环境的强化学习决策方法,属于深度强化学习攻防对抗技术领域。本发明针对异构多智能体对抗场景下强化学习难以训练的问题,基于分布执行集中训练的思想,通过结合长短期记忆网络引入历史数据,同时引入模仿学习加速算法收敛,最终实现了多智能体对抗的智能决策。