一种基于积分强化学习的核电功率跟踪控制方法

    公开(公告)号:CN113885328A

    公开(公告)日:2022-01-04

    申请号:CN202111212559.7

    申请日:2021-10-18

    Abstract: 本发明公开了一种基于积分强化学习的核电功率跟踪控制方法,包括:初始策略选取,相关参数初始化,初始功率点与期望功率点选取;开启全局迭代,开启局部迭代,利用策略迭代积分强化学习算法训练评价网络,修正网络权值,其中评价网络用来近似跟踪误差性能指标函数,并利用该评价网络权值评测当前跟踪误差控制系统的性能,通过执行流程选择最优控制策略,最小化一次全局迭代的总成本;判断当前局部迭代是否完成,若否,则返回局部迭代,否则更新迭代性能指标函数和跟踪控制律,以获得最优跟踪控制策略;全局策略迭代完成,得到最优跟踪控制策略,跟踪到期望功率点,计算总成本。由此,本发明可以不断地学习、调整当前策略跟踪到期望功率点。

    一种基于自适应值迭代核电系统的功率跟踪控制方法

    公开(公告)号:CN113868961A

    公开(公告)日:2021-12-31

    申请号:CN202111212919.3

    申请日:2021-10-18

    Abstract: 本发明公开了一种基于自适应动态规划值迭代的核电系统功率跟踪控制方法,包括:相关参数初始化;开启全局迭代,初始化评价网络权值,利用自适应动态规划值迭代算法训练评价网络,修正评价网络权值,其中评价网络用来近似跟踪误差值函数,并利用该评价网络评测当前误差控制策略的性能;通过执行流程选择最优跟踪误差控制策略,修正执行网络权值,更新一次全局迭代的成本;更新跟踪误差值函数和误差控制律,以获得最优解;判断当前是否满足收敛精度,若否,则返回全局迭代,否则根据最优跟踪误差值函数获得最优跟踪控制策略,跟踪到期望工况点。由此,本发明可以不断地学习、调整策略跟踪到期望工况点。

Patent Agency Ranking