一种网络资源优化方法、装置、设备和可读存储介质

    公开(公告)号:CN116887291A

    公开(公告)日:2023-10-13

    申请号:CN202310515070.X

    申请日:2023-05-09

    Abstract: 本发明提出一种网络资源优化方法、装置、设备和可读存储介质。首先构建一种集成接入回程(Integrated Access and Backhaul,IAB)架构,考虑该架构下多层干扰及各信道条件,以最大化系统上行链路总能效为目标构造目标函数。其次利用马尔科夫决策过程将所提问题构造为完全协作的多智能体问题,利用多智能体近端策略优化(Multi‑Agent Proximal Policy Optimization,MAPPO)构建分布式动作网络和集中式评价网络。最后通过本地动作网络与环境交互获取的数据信息,在评价网络的指导下对网络参数进行迭代更新,训练完成后的动作网络仅需本地状态信息即可做出资源分配决策。本发明所提资源优化方法考虑终端差异化需求以实现轻量化通信,另一方面所提多智能体框架进一步减少了信令开销和计算复杂度。

Patent Agency Ranking