基于多智能体强化学习的动态空中多目标分配、打击方法

    公开(公告)号:CN116956705A

    公开(公告)日:2023-10-27

    申请号:CN202310692675.6

    申请日:2023-06-12

    Abstract: 本发明涉及一种基于多智能体强化学习的动态空中多目标分配、打击方法,基于多智能体强化学习的多目标分配技术针对多目标打击方案进行智能生成。基于Q值强化学习网络设计了一种新的近似动态结构实现规模适应性目标分配;同时,利用动作结构中的反馈机制提升网络分配的稳定性。与现有方法相比,算法在满足一定打击成功率基础上实现分配方法对目标数量动态变化适应性和分配结果的及时更新。本发明实现了对目标数量动态变化情况中稳定实时的打击分配策略生成和更新;智能体之间的动作信息共享和与目标覆盖率关联的奖励函数共同作用,保证了所有空中目标被能够被均匀选择并打击,提升了本发明对于空中多目标打击任务的执行能力和执行效果。

    一种基于随机蒸馏网络的无人机机动目标跟踪方法

    公开(公告)号:CN118760226A

    公开(公告)日:2024-10-11

    申请号:CN202410914905.3

    申请日:2024-07-09

    Abstract: 本发明涉及一种基于随机蒸馏网络的无人机机动目标跟踪方法,属于无人机机动目标跟踪领域。包括:根据三维无人机机动目标跟踪场景构建动力学模型;将动力学模型抽象建模为马尔科夫决策过程,设计状态空间、动作空间及奖励函数;基于随机蒸馏网络的强化学习算法对马尔科夫决策过程求解奖励回报最大化的策略,使得无人机以最优轨迹跟踪机动目标。本发明针对三维目标跟踪场景,相比于二维场景更加真实,符合实际情况,能够更好地用于无人机系统中;在随机蒸馏网络的基础上增加一个预测器网络,进一步增大无人机的探索效率,使无人机能够更快地找到最优或次优解,加快收敛效率。

    基于灰狼算法的智能体路径搜索方法、设备和存储介质

    公开(公告)号:CN117516532A

    公开(公告)日:2024-02-06

    申请号:CN202311327062.9

    申请日:2023-10-13

    Abstract: 本申请的实施例涉及智能体路径搜索技术领域,公开了一种基于灰狼算法的智能体路径搜索方法、设备和存储介质,该方法包括:建立三维坐标系,基于智能体对应的任务信息确定路径的起始点和目标点,并根据起始点和目标点确定路径空间;利用基于灰狼算法改进的智能体路径优化算法,在路径空间内进行每一时刻下智能体的最优位置搜索;将每次得到的智能体的位置的坐标,转换到三维坐标系上,得到智能体对应的各个路径点;基于起始点和各个路径点得到智能体的最优路径,完成智能体的路径搜索,从而提高了灰狼算法更新的灵活性、解的多样性和收敛速度,避免智能体路径搜索陷入局部最优,准确地为智能体路径搜索寻找全局最优解。

Patent Agency Ranking