-
公开(公告)号:CN114280558A
公开(公告)日:2022-04-05
申请号:CN202111634317.7
申请日:2021-12-23
Applicant: 北京邮电大学
IPC: G01S7/38 , G06F30/27 , G06F111/08
Abstract: 现代自适应雷达具备自主模式切换和快速波形捷变能力,导致雷达信号状态难以穷举,传统干扰方式效能下降。本发明实例研究了一种基于强化学习的干扰信号波形优化方法:首先对干扰决策过程进行马尔可夫建模,在此基础上构建双层强化学习模型,通过两个交互的Q‑learning对干扰样式和波形参数进行联合优化。对抗过程中,在每段波束驻留时间内,对雷达信号进行工作模式检测,外层Q‑learning据此进行干扰样式决策,并映射至时、频域两个内层Q表,其次评估干扰效果并更新外层Q表。而后对该波束驻留时间内的每个雷达脉冲进行参数估计,在干扰样式的约束下基于内层Q‑learning求解时、频域干扰波形参数,生成干扰信号。最后计算时、频域有效干扰系数,更新内层Q表。
-
公开(公告)号:CN114280558B
公开(公告)日:2024-10-01
申请号:CN202111634317.7
申请日:2021-12-23
Applicant: 北京邮电大学
IPC: G01S7/38 , G06F30/27 , G06F111/08
Abstract: 现代自适应雷达具备自主模式切换和快速波形捷变能力,导致雷达信号状态难以穷举,传统干扰方式效能下降。本发明实例研究了一种基于强化学习的干扰信号波形优化方法:首先对干扰决策过程进行马尔可夫建模,在此基础上构建双层强化学习模型,通过两个交互的Q‑learning对干扰样式和波形参数进行联合优化。对抗过程中,在每段波束驻留时间内,对雷达信号进行工作模式检测,外层Q‑learning据此进行干扰样式决策,并映射至时、频域两个内层Q表,其次评估干扰效果并更新外层Q表。而后对该波束驻留时间内的每个雷达脉冲进行参数估计,在干扰样式的约束下基于内层Q‑learning求解时、频域干扰波形参数,生成干扰信号。最后计算时、频域有效干扰系数,更新内层Q表。
-