一种基于反射内存网的智能体数据交互方法、系统及设备

    公开(公告)号:CN119004998A

    公开(公告)日:2024-11-22

    申请号:CN202411182163.6

    申请日:2024-08-27

    Abstract: 本发明提出一种基于反射内存网的智能体数据交互方法、系统及设备,基于预设的全局参数配置文件,生成智能体和目标机器ID;通过读取本地节点的实时节点卡,得到本地节点对应的第一观测量;通过读取目标节点实时节点卡,得到对应的动作决策;通过对本地节点的实时节点卡进行更新,得到本地节点对应的第二观测量和对应的动作奖励值;对智能体进行强化学习训练,得到决策智能体;接收本地节点输出的控制信号,将所述控制信号返回至对应的目标机器ID的目标节点进行数据交互。本发明解决现有技术在多平台智能体数据交互过程中数据不兼容以及数据传输存在滞后性,导致系统数据交互效率低的问题。本发明简化交互流程,提高系统数据交互效率。

    一种基于自适应演化的电力系统多智能体并行训练方法

    公开(公告)号:CN119476403A

    公开(公告)日:2025-02-18

    申请号:CN202411483155.5

    申请日:2024-10-23

    Abstract: 本发明提供了一种基于自适应演化的电力系统多智能体并行训练方法,包括:基于待控制新型电力系统构建系统仿真模型;基于系统仿真模型构建初始多智能体;初始化多智能体中每个智能体的网络参数,得到若干个训练智能体;对若干个训练智能体进行分布式并行训练,直至所有训练智能体训练完成,得到当前轮多智能体;获取当前轮智能体群中各个智能体的适应度,并基于适应度进行选择、交叉和变异,获取新的智能体对若干个训练智能体进行更新;重复执行对若干个训练智能体的分布式并行训练,直至满足预设训练条件,获取智能体群;基于智能体群对待控制新型电力系统进行控制。该方法能极大提高多智能体的训练速度,有效提升新型电力系统的控制效率。

Patent Agency Ranking