一种基于期望值函数的深度强化学习训练加速方法

    公开(公告)号:CN111339690A

    公开(公告)日:2020-06-26

    申请号:CN202010313846.6

    申请日:2020-04-20

    IPC分类号: G06F30/20 G06N3/08

    摘要: 本发明提出一种基于期望值函数的深度强化学习训练加速方法。该方法针对深度强化学习因奖励稀疏而训练缓慢的问题,引入基于期望值函数的辅助评价指标来评估动作表现,从而加快训练速度。该方法主要包括:构建神经网络并进行参数初始化;计算相邻两个状态的动作值函数;利于动作值函数与策略的期望求得期望值函数,并通过期望值函数得到辅助评价指标;最后通过添加辅助评价指标项构建符合损失函数用以更准确的更新值函数网络参数。该方法适用于深度Q神经网络架构算法,能够通过更准确地评估动作表现来加快深度强化学习的训练速度。

    一种多高度下雷达地形遮蔽盲区的快速计算方法

    公开(公告)号:CN111060882A

    公开(公告)日:2020-04-24

    申请号:CN202010151465.2

    申请日:2020-03-06

    IPC分类号: G01S7/40

    摘要: 本发明提出了一种多高度下雷达地形遮蔽盲区的快速计算方法,包括:设置雷达的参数信息,将需要计算的多个突防飞行高度进行排序;使用二分查找法和邻近贪心法计算飞机飞行的最小高度层和最大高度层下雷达的探测范围;将最小高度层和最大高度层下雷达的探测范围,作为次小高度层的最小探测范围和最大探测范围,在此区间内计算次小高度层的雷达探测范围,将计算结果作为下一次计算中的最小探测范围;计算出所有高度的雷达探测范围,得到多高度下雷达地形遮蔽盲区,将计算出的结果着色显示。本发明能够有效减少计算量,快速求取多高度下的雷达地形遮蔽盲区。

    一种多高度下雷达地形遮蔽盲区的快速计算方法

    公开(公告)号:CN111060882B

    公开(公告)日:2021-03-16

    申请号:CN202010151465.2

    申请日:2020-03-06

    IPC分类号: G01S7/40

    摘要: 本发明提出了一种多高度下雷达地形遮蔽盲区的快速计算方法,包括:设置雷达的参数信息,将需要计算的多个突防飞行高度进行排序;使用二分查找法和邻近贪心法计算飞机飞行的最小高度层和最大高度层下雷达的探测范围;将最小高度层和最大高度层下雷达的探测范围,作为次小高度层的最小探测范围和最大探测范围,在此区间内计算次小高度层的雷达探测范围,将计算结果作为下一次计算中的最小探测范围;计算出所有高度的雷达探测范围,得到多高度下雷达地形遮蔽盲区,将计算出的结果着色显示。本发明能够有效减少计算量,快速求取多高度下的雷达地形遮蔽盲区。