基于深度强化学习的多用户多信道动态频谱接入方法

    公开(公告)号:CN113423110A

    公开(公告)日:2021-09-21

    申请号:CN202110689829.7

    申请日:2021-06-22

    Abstract: 本发明公开了基于深度强化学习的多用户多信道动态频谱接入方法,包括以下步骤:首先初始化参数,其次观察当前频谱环境,然后,各次用户通过评估神经网络,得到在当前状态下所有动作的Q值,并依据策略选择下一步的动作;执行动作后,各次用户会获取回报,同时频谱环境会转入一个新状态;然后存储记忆,当记忆量累积到自定义的规模后,开始学习,更新评估神经网络参数;然后更新目标神经网络的参数;重复以上步骤直至收敛,获得最优的接入策略。本发明在频谱环境先验知识未知的条件下动态地调整频谱接入策略,在不干扰主用户通信质量的前提下,减少用户之间的碰撞,达到提升系统吞吐量的目的。

    基于深度强化学习的多用户多信道动态频谱接入方法

    公开(公告)号:CN113423110B

    公开(公告)日:2022-04-12

    申请号:CN202110689829.7

    申请日:2021-06-22

    Abstract: 本发明公开了基于深度强化学习的多用户多信道动态频谱接入方法,包括以下步骤:首先初始化参数,其次观察当前频谱环境,然后,各次用户通过评估神经网络,得到在当前状态下所有动作的Q值,并依据策略选择下一步的动作;执行动作后,各次用户会获取回报,同时频谱环境会转入一个新状态;然后存储记忆,当记忆量累积到自定义的规模后,开始学习,更新评估神经网络参数;然后更新目标神经网络的参数;重复以上步骤直至收敛,获得最优的接入策略。本发明在频谱环境先验知识未知的条件下动态地调整频谱接入策略,在不干扰主用户通信质量的前提下,减少用户之间的碰撞,达到提升系统吞吐量的目的。

Patent Agency Ranking