- 专利标题: 一种基于强化学习的多阶段装备组合规划方法
-
申请号: CN201911165682.0申请日: 2019-11-25
-
公开(公告)号: CN110989343B公开(公告)日: 2020-08-28
- 发明人: 张骁雄 , 李明浩 , 丁鲲 , 夏博远 , 张慧
- 申请人: 中国人民解放军国防科技大学
- 申请人地址: 湖南省长沙市湖南长沙市开福区德雅路108号
- 专利权人: 中国人民解放军国防科技大学
- 当前专利权人: 中国人民解放军国防科技大学
- 当前专利权人地址: 湖南省长沙市湖南长沙市开福区德雅路108号
- 代理机构: 江苏瑞途律师事务所
- 代理商 韦超峰; 金龙
- 主分类号: G05B13/04
- IPC分类号: G05B13/04
摘要:
本发明公开了一种基于强化学习的多阶段装备组合规划方法,属于装备发展规划技术领域。该方法首先根据装备发展的需求确定所需输入参数;然后构建组合优化模型,构建组合优化模型时首先构建单阶段多场景的优化模型,再建立多阶段多场景的组合优化模型;然后基于强化学习中的Q‑Learning方法,构建优化求解算法。该求解算法首先采用NSGA算法或MOEA算法求解当前阶段的Pareto解集,然后借助Q‑Learning方法获得最优的组合方案;最后输入参数,并求解得到最终组合方案。本发明的方法能够针对多场景、多阶段的复杂环境,能够快速、高效地得到最优的装备组合规划方案,为决策者提供参考,从而使决策者快速地响应,做出准确的决策。
公开/授权文献
- CN110989343A 一种基于强化学习的多阶段装备组合规划方法 公开/授权日:2020-04-10