基于视觉的机器人的控制方法、设备及存储介质

    公开(公告)号:CN114800530A

    公开(公告)日:2022-07-29

    申请号:CN202210647458.0

    申请日:2022-06-09

    Abstract: 本发明公开了一种基于视觉的机器人的控制方法、设备及存储介质,该方法包括:步骤1,通过与机器人通信连接的摄像头按预设时间间隔获取多张包含机器人和环境的图像,将获取的多张图像通过强化学习帧栈堆叠得到用于后续控制的输入图像数据;步骤2,使用训练好的卷积特征编码器对步骤1中得到的输入图像数据进行编码,得到一个50维的向量即为T‑级奖励序列表征数据;步骤3,使用训练好的多层感知决策模型将步骤2中得到的T‑级奖励序列表征数据映射为一个最优动作,使机器人执行该最优动作来对该机器人进行最优控制。该发明能够极大地提升强化学习算法的泛化能力以缓解未知视觉干扰的影响,促进强化学习算法更好地落地应用。

    基于视觉的机器人的控制方法、设备及存储介质

    公开(公告)号:CN114800530B

    公开(公告)日:2023-11-28

    申请号:CN202210647458.0

    申请日:2022-06-09

    Abstract: 本发明公开了一种基于视觉的机器人的控制方法、设备及存储介质,该方法包括:步骤1,通过与机器人通信连接的摄像头按预设时间间隔获取多张包含机器人和环境的图像,将获取的多张图像通过强化学习帧栈堆叠得到用于后续控制的输入图像数据;步骤2,使用训练好的卷积特征编码器对步骤1中得到的输入图像数据进行编码,得到一个50维的向量即为T‑级奖励序列表征数据;步骤3,使用训练好的多层感知决策模型将步骤2中得到的T‑级奖励序列表征数据映射为一个最优动作,使机器人执行该最优动作来对该机器人进行最优控制。该发明能够极大地提升强化学习算法的泛化能力以缓解未知视觉干扰的影响,促进强化学习算法更好地落地应用。

Patent Agency Ranking