一种基于深度强化学习的大规模城市应急物资分配方法

    公开(公告)号:CN114693089A

    公开(公告)日:2022-07-01

    申请号:CN202210257857.6

    申请日:2022-03-14

    Abstract: 本发明涉及一种基于深度强化学习的大规模城市应急物资分配方法,结合深度学习和强化学习的优点,利用DQN网络进行方法的训练,实现大规模城市灾害响应场景下的应急物资分配。具体包括如下步骤:步骤一,对受灾区进行建模,构建应急物资分配任务模型;步骤二,定义面向多受灾区的应急物资分配联合目标优化函数;步骤三,构建马尔可夫决策过程,定义环境状态,动作空间及奖励函数等内容;步骤四,训练深度强化学习模型;步骤五,输入受灾区初始状态,生成最优应急分配策略。本发明提供的应急物资分配方法,在保障公平有效地进行应急物资分配以减轻灾民痛苦的前提下,有着更高的计算效率,提高了应急响应速度,进一步减少灾害造成的损失。

    一种基于深度强化学习的大规模城市应急物资分配方法

    公开(公告)号:CN114693089B

    公开(公告)日:2024-09-06

    申请号:CN202210257857.6

    申请日:2022-03-14

    Abstract: 本发明涉及一种基于深度强化学习的大规模城市应急物资分配方法,结合深度学习和强化学习的优点,利用DQN网络进行方法的训练,实现大规模城市灾害响应场景下的应急物资分配。具体包括如下步骤:步骤一,对受灾区进行建模,构建应急物资分配任务模型;步骤二,定义面向多受灾区的应急物资分配联合目标优化函数;步骤三,构建马尔可夫决策过程,定义环境状态,动作空间及奖励函数等内容;步骤四,训练深度强化学习模型;步骤五,输入受灾区初始状态,生成最优应急分配策略。本发明提供的应急物资分配方法,在保障公平有效地进行应急物资分配以减轻灾民痛苦的前提下,有着更高的计算效率,提高了应急响应速度,进一步减少灾害造成的损失。

Patent Agency Ranking