基于分层深度强化学习模型的机器人行为决策方法及设备

    公开(公告)号:CN115409158A

    公开(公告)日:2022-11-29

    申请号:CN202211052755.7

    申请日:2022-08-31

    Abstract: 本申请提供一种基于分层深度强化学习模型的机器人行为决策方法及设备,本申请通过模拟人脑的分层组织机理,提出了一个解决机器人稀疏奖励问题的深度分层强化学习模型,该模型包括顶层模块和底层模块两部分。在机器人环境认知的过程中,当其处于稀疏奖励的环境中时,上层模块根据智能体与环境的交互情况,为底层模块设定子目标,同时,上层模块可以感知环境并预测智能体的状态转移。此外,预测奖励和奖励增益被添加到该深度分层强化学习模型中来加速底层模块的学习速度,在底层模块中,设计了一个降维网络来编码和映射状态信息,因此,该深度分层强化学习模型可以有效解决智能体的稀疏奖励问题。

    一种用于电力屏柜操控的机械手指

    公开(公告)号:CN216913821U

    公开(公告)日:2022-07-08

    申请号:CN202220027365.3

    申请日:2022-01-07

    Abstract: 本实用新型涉及电力检测技术领域,公开了一种用于电力屏柜操控的机械手指,包括手指组件和双向同步驱动机构,所述手指组件包括X形剪式机构,以及由四个等长的橡胶棒首尾柔性相连形成的菱形框体,每个所述橡胶棒的两端内侧均设有楔形让位区,使相邻的两个橡胶棒能够绕其连接点转动,所述X形剪式机构包括中部相互铰接的第一支臂和第二支臂,第一支臂的上部和第二支臂的上部分别对应的与菱形框体任意相邻的两个橡胶棒固定连接,所述双向同步驱动机构包括两个能够同步接近或远离的滑块,所述第一支臂的下部和第二支臂的下部分别对应的与两个滑块铰接。该装置结构简单,动作灵活,能够避免损伤按键,且其按压动作能够有效避免电力屏柜的误操作。

Patent Agency Ranking