基于深度强化学习的重载铁路优化调度方法和装置

    公开(公告)号:CN118673648A

    公开(公告)日:2024-09-20

    申请号:CN202310258353.0

    申请日:2023-03-16

    摘要: 本公开涉及一种基于深度强化学习的重载铁路优化调度方法和装置,获取包括至少一个列车的列车集合,以及至少一个铁路轨道股道段的股道段集合。确定预设的作业类型集合以及调度约束条件,通过马尔科夫决策过程基于股道段集合、作业类型集合和调度约束条件生成用于确定铁路调度方案的序贯决策问题,并基于强化学习方法解决序贯决策问题得到铁路调度方案,其中包括每个列车的调度策略。本公开通过确定列车集合、股道段集合、作业集合以及约束条件的方式建立仿真环境,并根据马尔科夫决策过程基于仿真环境将铁路调度方案生成问题转化为序贯决策问题,并根据深度强化学习方法自动有效的生成铁路调度方案,提高了生成方案的效率以及效果。