-
公开(公告)号:CN118102389A
公开(公告)日:2024-05-28
申请号:CN202410090535.6
申请日:2024-01-23
Applicant: 南京邮电大学
IPC: H04W28/08 , H04W72/1273 , H04W72/50 , G06N3/042 , G06N3/092
Abstract: 本发明公开了一种基于DDPG的5G NR资源调度方法,包括:(1)针对5G时延敏感流量特性,建立对应的通信场景模型,并表示信道状态集合、调度动作集合,定义动作奖励;(2)根据动作器获取调度动作,与环境交互获取奖励以及下一时刻状态,并将信息存储至经验回放器;(3)从回放池中抽取训练样本,根据评论家计算目标值,并与当前奖励期望求差,利用最小损失函数更新网络参数,同时动作器根据当前奖励期望更新网络参数;(4)重复步骤(2)和步骤(3),算法收敛后用户的Q值等于真实动作价值,此时基站调度步骤(2)选择的用户就能实现最高的系统性能。本发明解决5G NR系统调度,实现更快的收敛速度,能确保系统的长期性能不弱于已有的调度算法。