基于注意力机制的深度强化学习集群对抗方法和系统

    公开(公告)号:CN119962616A

    公开(公告)日:2025-05-09

    申请号:CN202510450376.0

    申请日:2025-04-11

    Applicant: 同济大学

    Abstract: 本发明提供一种基于注意力机制的深度强化学习集群对抗方法和系统,包括小规模对抗场景下的嵌入注意力模块的深度强化学习模型的训练,以及大规模对抗场景下组别划分以及小组成员确定,并基于深度强化学习模型进行对抗指导。本方案中,基于注意力机制能够实现不同阵营和类型的智能体的个体权重以及其状态信息权重的配置,进而提高智能体在高动态环境下的决策效率和准确性。在大规模场景下进行组别划分和小组内成员确定,可以确保每个智能体能够根据当前态势有效地执行任务。通过集成注意力机制与深度强化学习技术,可实现智能体在动态复杂环境下的高效协同作战能力。

    基于层次博弈深度强化学习的集群追逃控制方法和系统

    公开(公告)号:CN119960489A

    公开(公告)日:2025-05-09

    申请号:CN202510450379.4

    申请日:2025-04-11

    Applicant: 同济大学

    Abstract: 本发明提供一种基于层次博弈深度强化学习的集群追逃控制方法和系统,通过层次博弈结构将多智能体协作任务建模为集体去中心化部分可观测马尔可夫决策过程,并提出一种层次博弈多智能体深度确定性策略梯度算法模型。该算法模型包括高层策略模块和低层策略模块,高层策略模块负责目标分配和任务协调,低层策略模块通过集中训练和分布式执行优化具体行动决策。本方案能够有效提高多智能体系统在复杂环境中的协作效率和应对能力。

Patent Agency Ranking