-
公开(公告)号:CN113423110A
公开(公告)日:2021-09-21
申请号:CN202110689829.7
申请日:2021-06-22
Applicant: 东南大学 , 网络通信与安全紫金山实验室
IPC: H04W16/10 , H04B17/382 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于深度强化学习的多用户多信道动态频谱接入方法,包括以下步骤:首先初始化参数,其次观察当前频谱环境,然后,各次用户通过评估神经网络,得到在当前状态下所有动作的Q值,并依据策略选择下一步的动作;执行动作后,各次用户会获取回报,同时频谱环境会转入一个新状态;然后存储记忆,当记忆量累积到自定义的规模后,开始学习,更新评估神经网络参数;然后更新目标神经网络的参数;重复以上步骤直至收敛,获得最优的接入策略。本发明在频谱环境先验知识未知的条件下动态地调整频谱接入策略,在不干扰主用户通信质量的前提下,减少用户之间的碰撞,达到提升系统吞吐量的目的。
-
公开(公告)号:CN113423110B
公开(公告)日:2022-04-12
申请号:CN202110689829.7
申请日:2021-06-22
Applicant: 东南大学 , 网络通信与安全紫金山实验室
IPC: H04W16/10 , H04B17/382 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于深度强化学习的多用户多信道动态频谱接入方法,包括以下步骤:首先初始化参数,其次观察当前频谱环境,然后,各次用户通过评估神经网络,得到在当前状态下所有动作的Q值,并依据策略选择下一步的动作;执行动作后,各次用户会获取回报,同时频谱环境会转入一个新状态;然后存储记忆,当记忆量累积到自定义的规模后,开始学习,更新评估神经网络参数;然后更新目标神经网络的参数;重复以上步骤直至收敛,获得最优的接入策略。本发明在频谱环境先验知识未知的条件下动态地调整频谱接入策略,在不干扰主用户通信质量的前提下,减少用户之间的碰撞,达到提升系统吞吐量的目的。
-