-
公开(公告)号:CN114501468A
公开(公告)日:2022-05-13
申请号:CN202210161507.X
申请日:2022-02-22
Applicant: 上海大学
IPC: H04W16/10 , H04W28/20 , H04W28/24 , H04L41/0893
Abstract: 一种TDD网络中联合上下行切片资源分配的方法,通过构建无线接入网仿真环境,在单步内针对被服务的各个切片的用户分别进行资源调度后,在当前Step中将上一个单步运行得到的状态输入到深度确定策略梯度算法实例化得到智能体的神经网络中,通过神经网络得到动作作用于当前Step的无线接入网仿真环境,环境运行后反馈更新状态和所执行的动作对应的奖励,并将状态、动作、奖励、State’作为一条经验存入智能体的记忆池,当储存的经验数量到达设定的阈值时,抽取其中的经验对智能体进行训练,智能体训练结束后,将训练得到的智能体进行在线测试。本发明基于深度确定性策略梯度算法,避免了某个切片的意外溢出而导致SLA的下降。