一种基于深度强化学习的波形自适应遴选方法

    公开(公告)号:CN115561723A

    公开(公告)日:2023-01-03

    申请号:CN202211277900.1

    申请日:2022-10-19

    Abstract: 本发明公开了一种基于深度强化学习的波形自适应遴选方法,包括:首先通过构建离散系统状态空间模型,对仿真场景进行建模;再通过最小化目标参数估计的克拉美罗下界构建目标熵状态,通过前后时刻的真实熵状态构建波形参数选择动作的真实熵奖励;再利用容积卡尔曼滤波器对当前时刻不同波形参数选择动作的下一时刻目标状态进行预测;再根据预测的熵状态构建预测熵奖励组成前馈循环通路;最后针对多节点场景设计下动作奖励函数,利用DQN网络对不同状态下不同动作的奖励期望进行价值逼近,得到最终的波形参数选择动作;本发明能够在动态环境中快速的适应环境学习动作选择策略,根据环境的反馈快速自适应的选择发射波形参数动作,鲁棒性强。

    一种基于迁移强化学习的快速网络化雷达节点遴选方法

    公开(公告)号:CN116400312A

    公开(公告)日:2023-07-07

    申请号:CN202310018283.1

    申请日:2023-01-06

    Abstract: 本发明提供一种基于迁移强化学习的快速网络化雷达节点遴选方法,属于雷达信号处理技术领域;包括构建蒙特卡洛搜索树并确定节点属性,根据选择决策,选出需被扩展的节点,通过节点选择,将从根节点至终止状态子节点的雷达节点集合作为一次遴选方案,采用评价函数进行模拟,确定性能,进而对所有访问过的节点,修改节点属性,并通过反向传播改变对应树节点的选择概率,结束一次训练迭代,多次训练后得出蒙特卡洛搜索树的最优节点遴选组合;通过对同一棵树的重复训练,保存训练结果参数,实时搜索时,微调训练后的蒙特卡洛搜索树,逐层遴选出最优的雷达节点组合;本发明可在数以亿计的节点组合中,在极短的时间给出满足实际要求的节点组合。

Patent Agency Ranking