-
公开(公告)号:CN116934114A
公开(公告)日:2023-10-24
申请号:CN202310876879.5
申请日:2023-07-17
Applicant: 西北工业大学
IPC: G06Q10/0637 , G06Q50/26 , G06F30/20
Abstract: 本发明提供了一种面向混合动作空间的模拟空战智能决策方法及装置,通过分立的两个策略网络解决离散的导弹发射决策动作和连续的机动决策动作引起的混合动作空间问题,同时迭代离散策略网络与连续策略网络以获得最优空战决策网络。将获取的智能体的当前状态输入最终空战决策网络,以使最终空战决策网络输出奖励最高的执行策略;本发明将导弹是否击中目标这一客观现象作为评价体系,并在建模过程中将发射导弹决策与机动决策进行联合建模,并引入脱靶量作为奖励函数的影响因素。按照奖励最高的执行策略执行空战任务,从而完成从通过机动决策进行态势占位到发射导弹决策引导导弹击毁目标的完整空战任务。