一种用全纯嵌入法引导深度强化学习的实时最优潮流方法
Abstract:
本申请公开了一种用全纯嵌入法引导深度强化学习的实时最优潮流方法,涉及电力系统优化运行技术领域。其中方法包括:分别定义电力系统的系统状态变量和策略动作变量;基于所述系统状态变量和所述策略动作变量,构建所述电力系统对应的策略模型,其中,所述策略模型对应的经验缓冲区中仅存储系统状态;将所述电力系统的非线性潮流方程转换为全纯函数,以构建所述电力系统对应的评论者函数;对所述评论者函数和所述策略模型进行交替更新迭代,当满足预设收敛条件时,输出最终更新后的策略模型,并确定所述电力系统对应的最优策略动作。本申请能够解决深度强化学习算法在电力系统优化过程中所存在的适应性和安全性的问题。
Patent Agency Ranking
0/0