发明公开
- 专利标题: 一种基于图卷积神经网络的近端策略优化方法
-
申请号: CN202211554345.2申请日: 2022-12-06
-
公开(公告)号: CN115983373A公开(公告)日: 2023-04-18
- 发明人: 朱涛 , 李文云 , 黄伟 , 周胜超 , 海迪 , 张瑞颖 , 周艳平 , 魏靖 , 朱元富
- 申请人: 云南电网有限责任公司昆明供电局
- 申请人地址: 云南省昆明市官渡区太和街道办事处吴井路98号
- 专利权人: 云南电网有限责任公司昆明供电局
- 当前专利权人: 云南电网有限责任公司昆明供电局
- 当前专利权人地址: 云南省昆明市官渡区太和街道办事处吴井路98号
- 代理机构: 南京禹为知识产权代理事务所
- 代理商 周局
- 主分类号: G06N3/092
- IPC分类号: G06N3/092 ; G06N3/048 ; G06N3/0464
摘要:
本发明公开了一种基于图卷积神经网络的近端策略优化方法,包括以下步骤:构建训练DRL智能体所需的基于图卷积层的Actor神经网络和Critic神经网络以及一个经验轨迹缓存池;在当前回合通过Actor网络产生随机动作来探索环境,生成经验轨迹来填充缓存池,然后使用缓存池里的经验轨迹对Actor网络和Critic网络的参数进行更新,最后将模型进行保存,利用训练好的Actor网络模型输出使奖励值最大的动作,实现对环境状态的最佳响应。本发明提供了一种基于图卷积神经网络的近端策略优化方法,可有效提高强化学习对图数据的感知能力,增强智能体的扩展能力和鲁棒性。