一种被控系统运行调度的高效率强化学习方法及装置

    公开(公告)号:CN118674066A

    公开(公告)日:2024-09-20

    申请号:CN202410798963.4

    申请日:2024-06-20

    摘要: 本发明涉及强化学习领域,提供了一种被控系统运行调度的高效率强化学习方法及装置,方法包括:对被控系统的各状态‑动作对进行采样,根据采样结果确定各状态下各动作的动作类型、Q因子样本方差及已消耗样本总量;利用采样数据分配算法确定各状态下各动作目标样本量;根据各动作目标样本量与各动作已消耗样本量,确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样的仿真结果重新确定各动作的动作类型、各状态‑动作对的Q因子样本方差;调整已消耗采样总量,判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够区分各状态动作的重要性,提升采样效率及优化策略性能。

    一种被控系统群的运行策略协同优化方法及装置

    公开(公告)号:CN118674109A

    公开(公告)日:2024-09-20

    申请号:CN202410798959.8

    申请日:2024-06-20

    摘要: 本发明涉及运行策略优化领域,提供了一种被控系统群的运行策略协同优化方法及装置,方法包括:根据仿真结果确定各动作的Q因子样本方差、各最优动作与非最优动作的Q因子融合值的性能差别以及已消耗样本总量;利用采样数据分配算法对上述量进行分析得到各动作目标样本量;根据各动作目标样本量与各动作已消耗样本量确定各动作补充采样量;根据补充采样量进行补充采样,利用补充仿真结果重新确定各动作的Q因子样本方差、性能差别以及已消耗样本总量;调整已消耗样本总量,判断已消耗样本总量是否小于预设总采样量,若是重新计算目标样本量及之后步骤,若否输出最优动作。本发明协同使用动作一致性的被控系统的运行数据,能够提升优化效率及性能。

    一种被控系统运行调度的监督强化学习方法及装置

    公开(公告)号:CN118674068A

    公开(公告)日:2024-09-20

    申请号:CN202410804234.5

    申请日:2024-06-20

    摘要: 本发明涉及强化学习领域,提供了一种被控系统运行调度的监督强化学习方法及装置,包括:确定各状态‑动作对的Q因子、Q因子样本方差以及已消耗样本总量;计算各状态下各非观测最优动作的重要性,将重要性排名前△M个非观测最优动作发送至监督者;调整已消耗采样总量,利用采样数据分配算法对各状态‑动作对的Q因子样本方差及已消耗样本总量进行分析得到各状态下各动作目标样本量;确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样结果重新确定之前的步骤;判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够将监督者的监督与采样数据融合起来,提升学习效率及性能。

    一种电磁暂态实时仿真通信组件的评测方法、装置和设备

    公开(公告)号:CN116915676B

    公开(公告)日:2024-09-06

    申请号:CN202310859079.2

    申请日:2023-07-13

    摘要: 本发明公开了一种电磁暂态实时仿真通信组件的评测方法、装置和设备,通过在分布式互联架构的电磁暂态实时仿真系统中每一个计算节点的内存上随机生成任意小样本数据,通过操作系统启动该测试程序将数据从分布式互联架构中的任意1个节点以广播方式发送至其余任意节点中,其中每一个发送准备、发送就绪、接收就绪、接收完成步骤均获取相应时间戳。测试程序可测试不低于100万次以上,通过大量的测试及其结果的分析,可以对分布式互联架构的电磁暂态实时仿真系统通信组件的抖动性能进行精准测试,有效识别其中存在的异常值,为整体系统的性能调优、调试提供参考依据和改进建议。

    电力实时仿真中的步长同步校准方法、装置及相关设备

    公开(公告)号:CN115459897B

    公开(公告)日:2024-06-04

    申请号:CN202211077526.0

    申请日:2022-09-02

    IPC分类号: H04L7/00 H04J3/06

    摘要: 本申请公开了一种电力实时仿真中的步长同步校准方法、装置及相关设备,该方法包括:当接收到同步源发送出的同步信号时,获取此时的接收时刻;将所述接收时刻减去上一个接收时刻,得到接收间隔;基于所述接收间隔、上一周期的计数值、计数器在当前周期的计数值、所述计数器的计数周期和同步信号的通信间隔,确定当前周期的计数值,所述通信间隔为预先获取的;基于当前周期的计数值、上一周期的计数值、预设的目标步长、同步源发送同步信号的目标时间间隔、所述计数周期以及同步源到仿真核的通信时延,确定下一次仿真步长的起始计数值,其中,所述通信时延为预先获取的。本申请充分虑及了通信通道的通信抖动情况,有利于实现各仿真核的同步仿真。