-
公开(公告)号:CN114693089A
公开(公告)日:2022-07-01
申请号:CN202210257857.6
申请日:2022-03-14
Applicant: 北京交通大学
Abstract: 本发明涉及一种基于深度强化学习的大规模城市应急物资分配方法,结合深度学习和强化学习的优点,利用DQN网络进行方法的训练,实现大规模城市灾害响应场景下的应急物资分配。具体包括如下步骤:步骤一,对受灾区进行建模,构建应急物资分配任务模型;步骤二,定义面向多受灾区的应急物资分配联合目标优化函数;步骤三,构建马尔可夫决策过程,定义环境状态,动作空间及奖励函数等内容;步骤四,训练深度强化学习模型;步骤五,输入受灾区初始状态,生成最优应急分配策略。本发明提供的应急物资分配方法,在保障公平有效地进行应急物资分配以减轻灾民痛苦的前提下,有着更高的计算效率,提高了应急响应速度,进一步减少灾害造成的损失。
-
公开(公告)号:CN114693089B
公开(公告)日:2024-09-06
申请号:CN202210257857.6
申请日:2022-03-14
Applicant: 北京交通大学
IPC: G06Q10/0631 , G06Q10/083 , G06Q50/26 , G06N3/092
Abstract: 本发明涉及一种基于深度强化学习的大规模城市应急物资分配方法,结合深度学习和强化学习的优点,利用DQN网络进行方法的训练,实现大规模城市灾害响应场景下的应急物资分配。具体包括如下步骤:步骤一,对受灾区进行建模,构建应急物资分配任务模型;步骤二,定义面向多受灾区的应急物资分配联合目标优化函数;步骤三,构建马尔可夫决策过程,定义环境状态,动作空间及奖励函数等内容;步骤四,训练深度强化学习模型;步骤五,输入受灾区初始状态,生成最优应急分配策略。本发明提供的应急物资分配方法,在保障公平有效地进行应急物资分配以减轻灾民痛苦的前提下,有着更高的计算效率,提高了应急响应速度,进一步减少灾害造成的损失。
-