一种被控系统运行调度的监督强化学习方法及装置

    公开(公告)号:CN118674068A

    公开(公告)日:2024-09-20

    申请号:CN202410804234.5

    申请日:2024-06-20

    摘要: 本发明涉及强化学习领域,提供了一种被控系统运行调度的监督强化学习方法及装置,包括:确定各状态‑动作对的Q因子、Q因子样本方差以及已消耗样本总量;计算各状态下各非观测最优动作的重要性,将重要性排名前△M个非观测最优动作发送至监督者;调整已消耗采样总量,利用采样数据分配算法对各状态‑动作对的Q因子样本方差及已消耗样本总量进行分析得到各状态下各动作目标样本量;确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样结果重新确定之前的步骤;判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够将监督者的监督与采样数据融合起来,提升学习效率及性能。

    一种电力系统电磁暂态仿真并行计算加速方法和相关装置

    公开(公告)号:CN117707770A

    公开(公告)日:2024-03-15

    申请号:CN202311720269.2

    申请日:2023-12-14

    IPC分类号: G06F9/50 G06F30/20 G06F113/04

    摘要: 本发明公开了一种电力系统电磁暂态仿真并行计算加速方法和相关装置,以平均到每个并行计算单元的时间为界限,按照电气量计算块的计算时间从大到小依次放入各个并行计算单元内,在所有电气量计算块都分配完之后,再以累计时间最大的并行计算单元和累计时间最小的并行计算单元的累计时间均值为条件,若累计时间均值不小于阈值,则将计算时间小于累计时间均值的电气量计算块中,在累计时间最大的并行计算单元里的电气量计算块移动到在累计时间最小的并行计算单元里。解决了现有的电力系统电磁暂态仿真计算过程没有充分考虑多并行计算单元的资源分配和顺序安排对最终计算时间的影响,难以实现对计算硬件系统的合理利用,难以提高计算效率的技术问题。

    电力实时仿真中通信间隔的校准方法、装置及相关设备

    公开(公告)号:CN115442244B

    公开(公告)日:2024-01-19

    申请号:CN202211072121.8

    申请日:2022-09-02

    IPC分类号: H04L41/14 H04L7/00 H04J3/06

    摘要: 本申请公开了一种电力实时仿真中通信间隔的校准方法、装置及相关设备,该方法包括:获取距离当前时刻最近的、预设长度的通信间隔序列,所述通信间隔序列中的通信间隔为接收到同步源的同步信号之间的间隔;基于所述通信间隔序列,构建第二间隔序列,所述第二间隔序列包括所述通信间隔序列中的多个局部最小值;基于所述第二间隔序列确定临界值,并从所述第二间隔序列中筛选出小于临界值的元素,得到第三间隔序列;获取所述第三间隔序列的均值,得到目标通信间隔。本申请考虑了由于通信扰动产生数据包重发而导致的通信时间延时和抖动,一定程度上消除了通信时间延时和抖动的干扰,能够得到比较接近真实状况的通信间隔。