基于深度强化学习的电网拓扑优化和潮流控制的方法

    公开(公告)号:CN114065452A

    公开(公告)日:2022-02-18

    申请号:CN202111362751.4

    申请日:2021-11-17

    Abstract: 本发明提供了一种基于深度强化学习的电网拓扑优化和潮流控制的方法,包括:构建智能体;获取历史断面潮流数据,并对多历史断面潮流数据进行模仿学习,以确定智能体的参数的初始值;对t时刻的在线断面潮流数据进行训练,得到N个动作价值排在前列的控制策略;在电网环境仿真器中验证N个价值排在前列的控制策略,获得回报最高的控制策略;执行回报最高的控制策略,得到执行该控制策略的奖励值;t的取值加1;循环求奖励值的步骤,每求得M次奖励值,根据动作价值函数的目标值更新智能体参数,完成所有时刻的在线断面潮流数据的智能体训练,从中选出最优的智能体参数;使用训练好的智能体在实时环境下完成电网拓扑优化和潮流控制。

    基于深度强化学习的负荷频率控制方法、装置及电子设备

    公开(公告)号:CN119109079A

    公开(公告)日:2024-12-10

    申请号:CN202411001461.0

    申请日:2024-07-25

    Abstract: 本公开涉及电力系统技术领域,公开了一种基于深度强化学习的负荷频率控制方法、装置及电子设备;其方法包括:针对任一区域子系统,利用对应的初始控制器参数确定模型,对当前状态数据进行处理,得到目标动作数据;在环境中执行各目标动作数据,得到奖励值和各目标区域子系统的当前状态数据;若各模型满足预设终止条件,则保存各模型参数以控制负荷频率;若各模型不满足预设终止条件,则针对任一目标模型,利用从对应的回放缓冲区中抽取的批量样本经验,对目标模型进行训练,将得到的训练后模型作为新的初始控制器参数确定模型;重置目标互联电力系统,并返回至第一步。本公开可以根据电力系统的状态,生成准确的PID控制器参数调整量。

Patent Agency Ranking