一种基于注意力的深度加速强化学习的目标定位方法

    公开(公告)号:CN110110847B

    公开(公告)日:2020-02-07

    申请号:CN201910362771.8

    申请日:2019-04-30

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于注意力的深度加速强化学习的目标定位方法,包括以下步骤:步骤一,向模型内输入图像,所述模型分为两个子网络,分别是深度强化学习网络和注意力网络;步骤二,模型处理图像,分为四个阶段:第一阶段,是深度强化学习的训练阶段,在强化学习框架下,目标定位任务会被对应到三个要素中去,该基于注意力的深度加速强化学习的目标定位方法,在原有的深度强化学习框架下添加了注意力网络;这个方法将利用强化学习训练过程产生的数据来对注意力网络进行训练,以此得到注意力向量,在这里将深度强化学习网络DQN黑盒问题研究转换为注意力向量的白盒问题,同时可利用注意力机制优化DQN对位置定位过程的控制。

    一种基于注意力的深度加速强化学习的目标定位方法

    公开(公告)号:CN110110847A

    公开(公告)日:2019-08-09

    申请号:CN201910362771.8

    申请日:2019-04-30

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于注意力的深度加速强化学习的目标定位方法,包括以下步骤:步骤一,向模型内输入图像,所述模型分为两个子网络,分别是深度强化学习网络和注意力网络;步骤二,模型处理图像,分为四个阶段:第一阶段,是深度强化学习的训练阶段,在强化学习框架下,目标定位任务会被对应到三个要素中去,该基于注意力的深度加速强化学习的目标定位方法,在原有的深度强化学习框架下添加了注意力网络;这个方法将利用强化学习训练过程产生的数据来对注意力网络进行训练,以此得到注意力向量,在这里将深度强化学习网络DQN黑盒问题研究转换为注意力向量的白盒问题,同时可利用注意力机制优化DQN对位置定位过程的控制。

Patent Agency Ranking