一种逆变器控制的强化学习训练过程加速方法

    公开(公告)号:CN118381368A

    公开(公告)日:2024-07-23

    申请号:CN202410509486.5

    申请日:2024-04-23

    Inventor: 叶剑 赵迪

    Abstract: 本发明公开了一种逆变器控制的强化学习训练过程加速方法,包括以下步骤:S1、强化学习控制模型构建;建立逆变器电路仿真模型作为强化学习训练环境,基于强化学习算法构建强化学习控制器模型;S2、强化学习算法设计,基于即时奖励更新强化学习智能体的神经网络参数;S3、即时奖励更新所述强化学习智能体的神经网络参数,直至参数收敛,提取出收敛的强化学习智能体参数应用于实际电路的控制。本发明采用上述的一种逆变器控制的强化学习训练过程加速方法,在训练过程中提高逆变器的输出电压频率,缩短了训练所需周期数下的训练时间,更快使强化学习智能体学习到最优策略,有效解决了针对逆变器控制的强化学习训练过程时间过长的问题。

    一种电力电子变换器的强化学习控制器训练环境架构

    公开(公告)号:CN118011785A

    公开(公告)日:2024-05-10

    申请号:CN202410157405.X

    申请日:2024-02-01

    Inventor: 叶剑 郭寰宇

    Abstract: 本发明公开了一种电力电子变换器的强化学习控制器训练环境架构,包括以下步骤:S1、构建强化学习控制器的整体训练环境设计架构;S2、设计强化学习控制器在每个Episode训练的训练时序图以及工况库;S3、从工况库中抽取训练工况到训练时序中时,根据不同工况的优先级设计概率分布;S4、基于提出的强化学习控制器的训练环境架构,对应用于电力电子变换器的强化学习控制器训练直至收敛。本发明采用上述的一种电力电子变换器的强化学习控制器训练环境架构,训练收敛以后的控制器有效提高了变换器运行时面对不同工况的适应性。当实际运行工况改变,如需要增加工况数目时,与训练工况相关的改动只需要在工况库中完成,而无需对训练时序进行调整。

    一种逆变器控制的强化学习训练过程加速方法

    公开(公告)号:CN118381368B

    公开(公告)日:2024-10-29

    申请号:CN202410509486.5

    申请日:2024-04-23

    Inventor: 叶剑 赵迪

    Abstract: 本发明公开了一种逆变器控制的强化学习训练过程加速方法,包括以下步骤:S1、强化学习控制模型构建;建立逆变器电路仿真模型作为强化学习训练环境,基于强化学习算法构建强化学习控制器模型;S2、强化学习算法设计,基于即时奖励更新强化学习智能体的神经网络参数;S3、即时奖励更新所述强化学习智能体的神经网络参数,直至参数收敛,提取出收敛的强化学习智能体参数应用于实际电路的控制。本发明采用上述的一种逆变器控制的强化学习训练过程加速方法,在训练过程中提高逆变器的输出电压频率,缩短了训练所需周期数下的训练时间,更快使强化学习智能体学习到最优策略,有效解决了针对逆变器控制的强化学习训练过程时间过长的问题。

Patent Agency Ranking