Patent search ap:("北京计算机技术及应用研究所") AND inv:"周剑峰" Page 1

1.

发明公开
针对异构多智能体仿真对抗环境的强化学习决策方法审中-实审

公开(公告)号：CN115542777A

公开(公告)日：2022-12-30

申请号：CN202211327589.7

申请日：2022-10-27

Applicant: 北京计算机技术及应用研究所

Inventor： 雷宇田 , 韩磊 , 周剑峰 , 冯政鑫 , 唐延辉 , 于丰齐 , 桓琦 , 郭敏 , 李宁 , 高景生

IPC: G05B17/02

Abstract: 本发明涉及一种针对异构多智能体仿真对抗环境的强化学习决策方法，属于深度强化学习攻防对抗技术领域。本发明针对异构多智能体对抗场景下强化学习难以训练的问题，基于分布执行集中训练的思想，通过结合长短期记忆网络引入历史数据，同时引入模仿学习加速算法收敛，最终实现了多智能体对抗的智能决策。

Patent Agency Ranking