-
公开(公告)号:CN119364495A
公开(公告)日:2025-01-24
申请号:CN202411276092.6
申请日:2024-09-12
Applicant: 东南大学
IPC: H04W52/14 , H04W52/34 , H04W52/36 , H04W72/0453 , H04B7/0426 , H04W72/23
Abstract: 本发明公开了一种多小区下行MIMO‑OFDM系统功率分配方法,首先对于所述通信系统建立长期吞吐量与功率切换代价模型,并采用基于深度强化学习的训练执行架构进行求解,所述架构由功率决策模块和训练中心评价模块组成;所述小区的智能体构建功率决策模块用于输出本地功率分配方案;各智能体将本地累积奖励值输入到训练中心的QMIX网络中,拟合出全局累积奖励值;最后,使用所述全局累积奖励值更新功率决策模块和全局QMIX网络参数。采用本发明方法,各智能体仅需要本地观测实现功率分配;此外,训练中心仅需要各智能体本地累积奖励值而非全局信息,能有效降低信令开销。