Patent search ap:("东南大学" OR "网络通信与安全紫金山实验室") AND inv:"苗本静" Page 1

1.

发明公开
基于深度强化学习的多用户多信道动态频谱接入方法有权

公开(公告)号：CN113423110A

公开(公告)日：2021-09-21

申请号：CN202110689829.7

申请日：2021-06-22

Applicant: 东南大学 , 网络通信与安全紫金山实验室

Inventor： 潘志文 , 苗本静 , 刘楠 , 尤肖虎

IPC: H04W16/10 , H04B17/382 , G06N3/04 , G06N3/08

Abstract: 本发明公开了基于深度强化学习的多用户多信道动态频谱接入方法，包括以下步骤：首先初始化参数，其次观察当前频谱环境，然后，各次用户通过评估神经网络，得到在当前状态下所有动作的Q值，并依据策略选择下一步的动作；执行动作后，各次用户会获取回报，同时频谱环境会转入一个新状态；然后存储记忆，当记忆量累积到自定义的规模后，开始学习，更新评估神经网络参数；然后更新目标神经网络的参数；重复以上步骤直至收敛，获得最优的接入策略。本发明在频谱环境先验知识未知的条件下动态地调整频谱接入策略，在不干扰主用户通信质量的前提下，减少用户之间的碰撞，达到提升系统吞吐量的目的。

2.

发明授权
基于深度强化学习的多用户多信道动态频谱接入方法有权

公开(公告)号：CN113423110B

公开(公告)日：2022-04-12

申请号：CN202110689829.7

申请日：2021-06-22

Applicant: 东南大学 , 网络通信与安全紫金山实验室

Inventor： 潘志文 , 苗本静 , 刘楠 , 尤肖虎

IPC: H04W16/10 , H04B17/382 , G06N3/04 , G06N3/08

Abstract: 本发明公开了基于深度强化学习的多用户多信道动态频谱接入方法，包括以下步骤：首先初始化参数，其次观察当前频谱环境，然后，各次用户通过评估神经网络，得到在当前状态下所有动作的Q值，并依据策略选择下一步的动作；执行动作后，各次用户会获取回报，同时频谱环境会转入一个新状态；然后存储记忆，当记忆量累积到自定义的规模后，开始学习，更新评估神经网络参数；然后更新目标神经网络的参数；重复以上步骤直至收敛，获得最优的接入策略。本发明在频谱环境先验知识未知的条件下动态地调整频谱接入策略，在不干扰主用户通信质量的前提下，减少用户之间的碰撞，达到提升系统吞吐量的目的。

Patent Agency Ranking