-
公开(公告)号:CN115343680A
公开(公告)日:2022-11-15
申请号:CN202210897254.2
申请日:2022-07-28
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于深度强化学习的联合自适应跳频和脉宽分配的雷达抗干扰智能决策方法,该方法包括:构建一个雷达抗干扰系统框架模型,其中频率捷变雷达利用携带的智能体,将雷达的当前状态作为深度强化学习的策略神经网络的输入,根据DQN中的动态ε贪婪算法进行动作选择,通过优化的脉冲发射频率和脉冲宽度选择抗干扰策略。智能体计算当前时隙动作产生的立即奖励,并将当前经验值存入经验回放池;当经验回放池中经验数量达到给定数量时,从经验池随机抽取一定数量的经验用于更新策略神经网络参数,同时每间隔固定时隙更新一次目标神经网络的参数。重复上述过程,实现基于深度强化学习的联合自适应跳频和脉宽分配的雷达抗干扰智能决策方法。
-
公开(公告)号:CN115103446A
公开(公告)日:2022-09-23
申请号:CN202210579127.8
申请日:2022-05-25
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于深度强化学习的多用户通信抗干扰智能决策方法,包括步骤:构建一个多用户无线通信抗干扰系统模型,首先基站将感知到的多用户和干扰机的当前频谱信息作为深度强化学习的策略神经网络的输入,然后根据动态贪婪算法选择联合动作,通过基站反馈帮助用户智能选择通信频段;同时,计算当前时隙联合动作产生的立即奖励,并将经验存入经验回放池中。当经验回放池中的经验数量达到给定值时,从经验池中随机抽取一定数量的经验更新策略神经网络的参数,并每间隔固定时隙更新一次目标神经网络的参数;重复训练过程,完成多用户通信抗干扰智能决策方法。本发明能实现多用户通信抗干扰,有效避免了外部干扰机和内部用户造成的通信干扰。
-