融合专家知识的多段软体机器人自适应强化学习控制方法

    公开(公告)号:CN118700192A

    公开(公告)日:2024-09-27

    申请号:CN202410779185.4

    申请日:2024-06-17

    Abstract: 本发明提供一种融合专家知识的多段软体机器人自适应强化学习控制方法,所述方法包括:利用马尔可夫决策过程MDP表征多段软体机器人与环境的相互作用;利用Q‑Learning算法识别MDP的最优动作选择策略;构建基于深度确定性策略梯度算法DDPG的无模型强化学习框架;在所述无模型强化学习框架中引入专家知识,包括:将专家演示数据引入样本池中,并利用专家演示数据设计奖励函数引导强化学习过程。本发明通过引入领域专家的经验和先验知识辅助学习过程,能够显著提升算法的数据利用效率,为复杂软体机器人系统的控制提供高效、鲁棒的解决方案。

    一种绳驱动软体机器人控制系统
    2.
    发明公开

    公开(公告)号:CN117961873A

    公开(公告)日:2024-05-03

    申请号:CN202410262380.X

    申请日:2024-03-07

    Abstract: 本发明公开了一种绳驱动软体机器人控制系统,属于软体机器人技术领域,所述系统包括:执行控制单元、驱动执行单元、感知反馈单元以及软体触手执行单元;所述感知反馈单元用于感知目标对象的空间位置信息,并将所述空间位置发送至所述执行控制单元;所述执行控制单元用于将接收到的所述空间位置信息与预期位置进行比较,依据比较结果以及所述驱动执行单元发送的绳传动机构的绳长变化量控制所述驱动执行单元;所述驱动执行单元用于控制电机转速及方向以改变绳传动机构的绳长,从而控制所述软体触手执行单元中软体触手的定位。本申请提供的绳驱动软体机器人控制系统,能够通过闭环控制算法实现对软体机器人的软体触手的高精度控制与定位。

Patent Agency Ranking