-
公开(公告)号:CN118283625A
公开(公告)日:2024-07-02
申请号:CN202410299498.X
申请日:2024-03-15
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于改进多智能体强化学习的接入网切片资源分配方法,包括1)针对5G时延敏感流量特性,建立对应的通信场景模型,并表示信道状态集合、调度动作集合,定义动作奖励;2)根据动作器获取调度动作,与环境交互获取奖励以及下一时刻状态,并将信息存储至经验回放器;3)从回放池中抽取训练样本,根据评论家计算目标值,并与当前奖励期望求差,利用最小损失函数更新网络参数,同时动作器根据当前奖励期望更新网络参数;4)重复步骤2)和步骤3),算法收敛后用户的Q值等于真实动作价值,此时基站调度步骤2)选择的用户实现最高系统性能。本发明解决了5G接入网切片资源分配问题,实现更快的收敛速度,提高了系统的长期性能。