一种基于图卷积神经网络的近端策略优化方法
摘要:
本发明公开了一种基于图卷积神经网络的近端策略优化方法,包括以下步骤:构建训练DRL智能体所需的基于图卷积层的Actor神经网络和Critic神经网络以及一个经验轨迹缓存池;在当前回合通过Actor网络产生随机动作来探索环境,生成经验轨迹来填充缓存池,然后使用缓存池里的经验轨迹对Actor网络和Critic网络的参数进行更新,最后将模型进行保存,利用训练好的Actor网络模型输出使奖励值最大的动作,实现对环境状态的最佳响应。本发明提供了一种基于图卷积神经网络的近端策略优化方法,可有效提高强化学习对图数据的感知能力,增强智能体的扩展能力和鲁棒性。
0/0