一种基于强化学习的换热站控制方法

    公开(公告)号:CN116430732A

    公开(公告)日:2023-07-14

    申请号:CN202310413177.3

    申请日:2023-04-17

    Applicant: 南京大学

    Inventor: 俞扬 何佳飞

    Abstract: 本发明公开一种基于强化学习的换热站控制方法,本发明主要由两部分组成,第一部分为基于生成对抗式的方法学习换热站的仿真环境模型,第二部分则使用PPO强化学习的技术进行换热真的控制策略训练,从而得到一个很好的换热站控制方法。基于换热站的历史数据构建换热站的仿真环境模型,并采用生成对抗式的方法来学习这个仿真环境模型,使得仿真环境能够在历史数据没有出现过的状态下也能获得很好的仿真效果。接着利用生成对抗结构学到的仿真环境模型去用PPO强化学习技术训练控制策略,由于PPO强化学习技术的训练过程较为稳定、训练过程方差较小,得到的控制策略能够很好的完成设计奖励函数给出的控制目标,并且控制结果温度不会出现滞后。

Patent Agency Ranking