一种盲六足机器人运动策略的训练方法

    公开(公告)号:CN117340876A

    公开(公告)日:2024-01-05

    申请号:CN202311273174.0

    申请日:2023-09-27

    Applicant: 无锡学院

    Abstract: 本发明公开了一种盲六足机器人运动策略的训练方法,属于六足机器人运动控制的技术领域;该方法基于盲六足机器人的内传感器获取本体感知信号,该信号可以满足盲六足机器人正常行走的最低要求,并可忽略恶劣天气的影响。使用近端策略优化算法训练盲六足机器人的运动策略,验证了盲六足机器人的马尔可夫性证明算法的可行性。本发明通过Mujoco建立了盲六足机器人在非结构化地面运动的环境,并在环境中通过强化学习算法训练得到运动策略,使盲六足机器人能根据当前环境做出自适应运动;证明该方法能使盲六足机器人在恶劣天气影响下也能稳定行走和简单避障,并通过非结构化地面。

    一种基于SAC算法的六足机器人运动策略的训练方法

    公开(公告)号:CN117474049A

    公开(公告)日:2024-01-30

    申请号:CN202311365851.1

    申请日:2023-10-20

    Applicant: 无锡学院

    Abstract: 本发明公开了一种基于SAC算法的六足机器人运动策略的训练方法,属于六足机器人运动控制的技术领域;包括以下步骤:S1、构建六足机器人和地形模型;S2、获取六足机器人的本体感知信号;S3、构建策略网络和价值网络;S4、构建SAC算法,通过价值网络来评估六足机器人当前动作和状态的价值,根据价值评估结果对策略网络进行迭代;S5、构建奖励函数,通过最大化奖励的方式来指导策略网络的训练和参数优化。本发明使用SAC算法对步态进行训练,该算法在目标函数中增加了熵项,对于复杂的任务有着出色的探索能力;本发明还优化了SAC算法中的策略网络,使其适应六足机器人的结构空间关系,并优化了强化学习算法中的奖励函数,可以生成优秀的移动策略。

Patent Agency Ranking