-
公开(公告)号:CN115987340B
公开(公告)日:2023-07-04
申请号:CN202310273343.4
申请日:2023-03-21
Applicant: 南京邮电大学
IPC: H04B7/0417 , H04B7/0452 , H04B7/0456
Abstract: 本发明公开了一种5G物联网信道相干且有限反馈条件下基于强化学习的用户调度方法,该方法包括:将5G物联网信道相干环境下用户容量具有弹性这一结论应用于设计用户调度算法中,使得系统可以同时容纳更多的用户,节约了空间资源;根据残留干扰公式,推导相应的用户可达速率表达式,降低计算复杂度,设计以最大化用户可达速率为目标的码字挑选准则;定义用户终端的动作价值为其可实现用户速率的期望,通过Q‑learning方法来估计,将用户终端的Q值定义为其动作价值置信区间的上界,并以Q值的大小作为用户选择的基准。该方法不需要尝试不同的用户组合来计算“速率和”,计算复杂度大大降低且不影响系统吞吐量。
-
公开(公告)号:CN115987340A
公开(公告)日:2023-04-18
申请号:CN202310273343.4
申请日:2023-03-21
Applicant: 南京邮电大学
IPC: H04B7/0417 , H04B7/0452 , H04B7/0456
Abstract: 本发明公开了一种5G物联网信道相干且有限反馈条件下基于强化学习的用户调度方法,该方法包括:将5G物联网信道相干环境下用户容量具有弹性这一结论应用于设计用户调度算法中,使得系统可以同时容纳更多的用户,节约了空间资源;根据残留干扰公式,推导相应的用户可达速率表达式,降低计算复杂度,设计以最大化用户可达速率为目标的码字挑选准则;定义用户终端的动作价值为其可实现用户速率的期望,通过Q‑learning方法来估计,将用户终端的Q值定义为其动作价值置信区间的上界,并以Q值的大小作为用户选择的基准。该方法不需要尝试不同的用户组合来计算“速率和”,计算复杂度大大降低且不影响系统吞吐量。
-