一种被控系统群的运行策略协同优化方法及装置

    公开(公告)号:CN118674109A

    公开(公告)日:2024-09-20

    申请号:CN202410798959.8

    申请日:2024-06-20

    摘要: 本发明涉及运行策略优化领域,提供了一种被控系统群的运行策略协同优化方法及装置,方法包括:根据仿真结果确定各动作的Q因子样本方差、各最优动作与非最优动作的Q因子融合值的性能差别以及已消耗样本总量;利用采样数据分配算法对上述量进行分析得到各动作目标样本量;根据各动作目标样本量与各动作已消耗样本量确定各动作补充采样量;根据补充采样量进行补充采样,利用补充仿真结果重新确定各动作的Q因子样本方差、性能差别以及已消耗样本总量;调整已消耗样本总量,判断已消耗样本总量是否小于预设总采样量,若是重新计算目标样本量及之后步骤,若否输出最优动作。本发明协同使用动作一致性的被控系统的运行数据,能够提升优化效率及性能。

    一种被控系统运行调度的监督强化学习方法及装置

    公开(公告)号:CN118674068A

    公开(公告)日:2024-09-20

    申请号:CN202410804234.5

    申请日:2024-06-20

    摘要: 本发明涉及强化学习领域,提供了一种被控系统运行调度的监督强化学习方法及装置,包括:确定各状态‑动作对的Q因子、Q因子样本方差以及已消耗样本总量;计算各状态下各非观测最优动作的重要性,将重要性排名前△M个非观测最优动作发送至监督者;调整已消耗采样总量,利用采样数据分配算法对各状态‑动作对的Q因子样本方差及已消耗样本总量进行分析得到各状态下各动作目标样本量;确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样结果重新确定之前的步骤;判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够将监督者的监督与采样数据融合起来,提升学习效率及性能。

    一种被控系统运行调度的高效率强化学习方法及装置

    公开(公告)号:CN118674066A

    公开(公告)日:2024-09-20

    申请号:CN202410798963.4

    申请日:2024-06-20

    摘要: 本发明涉及强化学习领域,提供了一种被控系统运行调度的高效率强化学习方法及装置,方法包括:对被控系统的各状态‑动作对进行采样,根据采样结果确定各状态下各动作的动作类型、Q因子样本方差及已消耗样本总量;利用采样数据分配算法确定各状态下各动作目标样本量;根据各动作目标样本量与各动作已消耗样本量,确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样的仿真结果重新确定各动作的动作类型、各状态‑动作对的Q因子样本方差;调整已消耗采样总量,判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够区分各状态动作的重要性,提升采样效率及优化策略性能。

    一种两类异构系统的联合仿真方法、系统、设备及介质

    公开(公告)号:CN118965799A

    公开(公告)日:2024-11-15

    申请号:CN202411150569.6

    申请日:2024-08-21

    摘要: 本申请公开了一种两类异构系统的联合仿真方法、系统、设备及介质,通过构建联合平台,集成两类异构系统的硬件和软件接口,以获取功能控制权限并匹配通信协议从而实现动态适应指令数据交换。能够根据当前网络和系统负载情况,通过负载均衡机制自动选择最适合的通信协议,以确保通信的可靠性和效率,适应不同的应用场景和需求,提升系统的可操作性和用户体验,通过双向解析过程,平台能对两类异构系统的指令数据进行预处理,进行双向解析和数据格式转换。通过预定义协议之间的映射规则,平台实现了数据格式的自动转换和重新封装,确保数据能够在不同协议之间顺畅传递和解析。从而解决了现有技术操作效率和通信准确性低且系统的稳定性较差的问题。

    一种桥臂单元模型的电压控制方法及装置

    公开(公告)号:CN115021536B

    公开(公告)日:2024-06-25

    申请号:CN202210860669.2

    申请日:2022-07-21

    IPC分类号: H02M1/088 H02M1/00 H02M1/36

    摘要: 本申请公开了一种桥臂单元模型的电压控制方法及装置,方法包括:构建桥臂的桥臂单元模型,通过桥臂单元模型接收外部输入的解闭锁控制信号,确定运算模块的解闭锁控制状态,与解闭锁控制电路的通断状态,通过运算模块获取电流测量仪测得的电流值,在解锁状态下,以电流值、预设电容值、子模块投入数和子模块总数作为运算参数,在运算模块中计算受控电压,并基于受控电压调整受控电压源。可见,本申请构建的桥臂单元模型减少了受控电压源与电流测量仪的数量,使得计算电压控制的参数时,能够考虑仅一个电流值,避免使用二维数组进行乘法积分运算,所计算得到的受控电压也能够仅对一个受控电压源进行控制,提高电压控制的效率和模型运算速度。