结合行为克隆和近端策略优化算法的干扰决策方法及系统

    公开(公告)号:CN116243254A

    公开(公告)日:2023-06-09

    申请号:CN202211656705.X

    申请日:2022-12-22

    Inventor: 娄雨璇 孙闽红

    Abstract: 本发明公开了一种结合行为克隆和近端策略优化算法的干扰决策方法及系统,本发明方法包括如下步骤:S1、随机初始化策略网络的网络参数和价值网络的网络参数;S2、基于行为克隆方法,训练策略网络;S3、干扰机根据当前策略与雷达进行交互,采样轨迹数据,并存入数据集中;S4、干扰机使用近端策略优化算法利用数据集中的轨迹数据进行策略网络优化;S5、重复执行步骤S3和步骤S4,直到得到最优策略。本发明在提升策略训练速度的同时,极大提高了干扰机的安全性。

Patent Agency Ranking