协作多无人系统贡献评估与决策方法、产品、介质及设备

    公开(公告)号:CN118551825A

    公开(公告)日:2024-08-27

    申请号:CN202410675450.4

    申请日:2024-05-28

    Applicant: 上海大学

    Abstract: 本发明公开一种协作多无人系统贡献评估与决策方法、产品、介质及设备,涉及协作多智能体强化学习领域,方法包括:基于每个无人系统的状态价值和优势动作价值,计算全局状态价值和优势动作价值,进而计算联合动作价值;利用联合动作价值和每个无人系统的动作价值分布,计算所有无人系统的联合动作价值分布;基于残差映射权重矩阵修正后的所有无人系统的联合动作价值分布以及每个无人系统的动作价值,对无人系统策略网络进行训练和优化;利用优化后的该网络进行决策。本发明能在面对复杂的、非单调的任务时,准确评估不同无人系统在团队奖励中的贡献占比,激励无人系统朝着最优协作策略前进,从而完成团队贡献度的合理分配。

    一种基于动态协作的多无人系统场景感知决策方法及系统

    公开(公告)号:CN118133887A

    公开(公告)日:2024-06-04

    申请号:CN202410323745.5

    申请日:2024-03-20

    Applicant: 上海大学

    Abstract: 本发明公开一种基于动态协作的多无人系统场景感知决策方法及系统,涉及多智能体强化学习领域,包括:获取各无人系统当前时刻的传感器信息和上一时刻的执行动作;将所有无人系统当前时刻的传感器信息和上一时刻的执行动作输入多无人系统场景感知决策模型,得到各无人系统当前时刻的执行动作;多无人系统场景感知决策模型包括训练好的第一网络模块、第二网络模块和第三网络模块;训练好的第一网络模块用于确定各无人系统当前时刻的时序轨迹预先编码向量;训练好的第二网络模块用于确定当前时刻的无人系统动态协作关系邻接矩阵;训练好的第三网络模块用于确定各无人系统当前时刻的执行动作。本发明提高各无人系统执行动作的有效性,促进团队协作。

Patent Agency Ranking