-
公开(公告)号:CN119250155A
公开(公告)日:2025-01-03
申请号:CN202411415921.4
申请日:2024-10-11
Applicant: 北京理工大学
IPC: G06N3/092 , G06N3/045 , G06N3/0455 , G06F18/20 , G06F123/02
Abstract: 本发明公开了一种基于PPO算法和Transformer‑XL框架的空战格斗策略训练方法,通过Gated Transformer‑XL框架中分段记忆和长程依赖关系的建模,使智能体在长时间序列数据的处理上更具优势,增强智能体对长时依赖关系的捕捉能力;智能体能够更好地适应动态变化的战场环境,提高策略的适用性和鲁棒性。