Patent search ap:("北京交通大学") AND inv:"邵丽丽" Page 1

1.

发明公开
一种基于深度强化学习的大规模城市应急物资分配方法有权

公开(公告)号：CN114693089A

公开(公告)日：2022-07-01

申请号：CN202210257857.6

申请日：2022-03-14

Applicant: 北京交通大学

Inventor： 常晓林 , 范俊超 , 邵丽丽 , 刘雅婷

IPC: G06Q10/06 , G06Q50/26 , G06N3/08 , G06N20/00

Abstract: 本发明涉及一种基于深度强化学习的大规模城市应急物资分配方法，结合深度学习和强化学习的优点，利用DQN网络进行方法的训练，实现大规模城市灾害响应场景下的应急物资分配。具体包括如下步骤：步骤一，对受灾区进行建模，构建应急物资分配任务模型；步骤二，定义面向多受灾区的应急物资分配联合目标优化函数；步骤三，构建马尔可夫决策过程，定义环境状态，动作空间及奖励函数等内容；步骤四，训练深度强化学习模型；步骤五，输入受灾区初始状态，生成最优应急分配策略。本发明提供的应急物资分配方法，在保障公平有效地进行应急物资分配以减轻灾民痛苦的前提下，有着更高的计算效率，提高了应急响应速度，进一步减少灾害造成的损失。

2.

发明授权
一种基于深度强化学习的大规模城市应急物资分配方法有权

公开(公告)号：CN114693089B

公开(公告)日：2024-09-06

申请号：CN202210257857.6

申请日：2022-03-14

Applicant: 北京交通大学

Inventor： 常晓林 , 范俊超 , 邵丽丽 , 刘雅婷

IPC: G06Q10/0631 , G06Q10/083 , G06Q50/26 , G06N3/092

Abstract: 本发明涉及一种基于深度强化学习的大规模城市应急物资分配方法，结合深度学习和强化学习的优点，利用DQN网络进行方法的训练，实现大规模城市灾害响应场景下的应急物资分配。具体包括如下步骤：步骤一，对受灾区进行建模，构建应急物资分配任务模型；步骤二，定义面向多受灾区的应急物资分配联合目标优化函数；步骤三，构建马尔可夫决策过程，定义环境状态，动作空间及奖励函数等内容；步骤四，训练深度强化学习模型；步骤五，输入受灾区初始状态，生成最优应急分配策略。本发明提供的应急物资分配方法，在保障公平有效地进行应急物资分配以减轻灾民痛苦的前提下，有着更高的计算效率，提高了应急响应速度，进一步减少灾害造成的损失。

Patent Agency Ranking