发明授权
- 专利标题: 一种基于强化学习的导弹制导方法和装置
-
申请号: CN202110775732.8申请日: 2021-07-09
-
公开(公告)号: CN113239472B公开(公告)日: 2021-09-21
- 发明人: 朱圆恒 , 李伟凡 , 熊华 , 赵冬斌
- 申请人: 中国科学院自动化研究所 , 北京电子工程总体研究所
- 申请人地址: 北京市海淀区中关村东路95号;
- 专利权人: 中国科学院自动化研究所,北京电子工程总体研究所
- 当前专利权人: 中国科学院自动化研究所,北京电子工程总体研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号;
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 张雅娜
- 主分类号: G06F30/15
- IPC分类号: G06F30/15 ; G06F30/27 ; G06N3/08 ; G06F111/08
摘要:
本发明提供一种基于强化学习的导弹制导方法和装置,其中方法包括:基于雷达信号,获取当前导弹和目标的位置、姿态信息,以及导弹当前剩余能量信息;基于当前导弹和目标的位置、姿态信息,以及导弹当前剩余能量信息,确定当前时刻的观测向量,并基于当前时刻以及上一时刻的观测向量,确定当前状态;将所述当前状态输入至动作网络,得到所述动作网络输出的动作,并基于所述动作,确定所述导弹的控制量;其中,所述动作网络是基于样本观测向量、每一时刻导弹采取的样本动作及其对应的奖励进行强化学习得到的。本发明提高了带角度约束的导弹围捕准确性。
公开/授权文献
- CN113239472A 一种基于强化学习的导弹制导方法和装置 公开/授权日:2021-08-10