基于深度强化学习的星地融合网络信息年龄优化方法

    公开(公告)号:CN118157745A

    公开(公告)日:2024-06-07

    申请号:CN202410288325.8

    申请日:2024-03-13

    Abstract: 本发明公开了基于深度强化学习的星地融合网络信息年龄优化方法,涉及通信技术领域,包括初始化新、旧策略网络和评价网络的网络参数,初始化环境参数、经验池、更新频率;新策略网络和环境交互,输入动作、得到即时奖励,进入下一状态,同时收集并储存经验数据;从经验池中随机采样经验数据,发送至3个网络进行训练;评价网络评价选择的动作;新策略网络更新并调整;评价网络通过损失函数进行更新;新策略网络更新F次后,同步至旧策略网络;多次训练后输出最优策略。本发明可以在满足最小通信速率的前提下,得到最优的发射功率分配方案,阻止信息年龄的增长,同时保证通信的有效性和可靠性。

Patent Agency Ranking