一种基于深度强化学习的智能目标分配方法及系统

    公开(公告)号:CN119130015A

    公开(公告)日:2024-12-13

    申请号:CN202411156158.8

    申请日:2024-08-22

    Inventor: 刘飞 彭程远 邵节

    Abstract: 本发明涉及人工智能与无人系统技术领域,公开了一种基于深度强化学习的智能目标分配方法及系统,利用多元渠道收集并分类保卫地状态、火力单元状态、敌方目标状态和历史分配方案,得到战场信息,将各类战场信息整合为键值对形式的字典,以字典观测空间形式作为态势输入;通过决策动作计算模型对输入信息进行目标分配,并生成决策指令;将决策指令转换为仿真环境可执行的动作,在高度仿真的对抗环境中,执行这些决策指令,模拟实际战斗过程,观察并记录行动效果,根据仿真结果评估决策指令,并生成评估反馈,根据评估反馈,调整决策动作计算模型参数,进行迭代优化;本发明显著增强了对抗体系的智能化水平与对抗效能。

Patent Agency Ranking