一种移动机器人深度强化学习控制方法

    公开(公告)号:CN114626505B

    公开(公告)日:2025-01-07

    申请号:CN202210207885.7

    申请日:2022-03-04

    Abstract: 本发明涉及一种移动机器人深度强化学习控制方法,属于机器人智能控制技术领域。在机器人学习行为策略阶段,本发明在最大熵强化学习框架下提出了一种具有历史行为重用的off‑policy似然比策略梯度模型学习算法,用于对移动机器人进行端对端的行为控制。该方法提高了机器人行为学习过程中数据的利用率,从而提高了学习速度和采样效率,节省了机器人与环境的交互成本。同时,在对机器人的行为策略模型进行评估阶段,本发明提出了一种统一的评价网络模型来同时逼近状态值函数和动作值函数,通过该评价网络可以直接给出一个状态和动作的优势函数。相对于使用两个网络分别逼近状态值函数和动作值函数,该评价网络具有学习速度快、能够减小参数累积误差的优势。

    一种基于两方博弈的无人系统主动目标监控方法

    公开(公告)号:CN115618738A

    公开(公告)日:2023-01-17

    申请号:CN202211340151.2

    申请日:2022-10-28

    Abstract: 本发明涉及一种基于两方博弈的无人系统主动目标监控方法,属于人工智能与目标监控技术领域。本方法充分考虑了目标监控任务中的目标运动的不确定性和对抗性,以及长时间监控中的监控能力,基于两方博弈构建了两个独立智能体交互过程,将整个监控过程分为监控阶段和搜索阶段,分别设计奖励函数。通过提升目标策略的多样性,实现监控者的奖励提升,从而延长监控过程的持续时间,减少搜索过程时间,提升了监控者在长时间监控任务中的监控性能。

    一种自适应调整范围的无人机群目标三维持续监控方法

    公开(公告)号:CN115542945A

    公开(公告)日:2022-12-30

    申请号:CN202211331938.2

    申请日:2022-10-28

    Abstract: 本发明涉及一种自适应调整范围的无人机群目标三维持续监控方法,属于无人机目标监控技术领域。本方法针对基于视觉检测的单无人机群目标三维持续监控问题,利用了有权图结构对群目标进行建模,在水平方向上,通过寻找中心位置进行飞行决策,在高度方向上,利用离线数据集结合离线强化学习算法,在考无人机虑能耗及视觉系准确率的情况下,实现自适应飞行高度决策。本方法能够自适应的调整无人机的检测范围,有效提升了单个无人机的监控性能。

    一种网球场发球机器人控制系统及控制方法

    公开(公告)号:CN106730754B

    公开(公告)日:2022-06-03

    申请号:CN201710032659.9

    申请日:2017-01-16

    Abstract: 本发明公开了一种网球场发球机器人控制系统及控制方法,所述网球场发球机器人控制方法通过基于ZigBee的远程通讯协议接收来自捡球机的控制信号;接收到发球指令后,依次启动拨球机构和发球机构,并通过两个机构的运转速度和时间来控制发球频率和力度。所述网球场发球机器人控制系统包括:捡球机控制器;发球机控制器;电机驱动模块;电机;稳压模块。本发明能够准确、稳定、全自动地发射网球供练习者击打,与捡球机器人通过ZigBee无线通信协议进行数据交换;能够通过预先设定好的程序实现自主发球;工作稳定、效率高。

    一种移动机器人深度强化学习控制方法

    公开(公告)号:CN114626505A

    公开(公告)日:2022-06-14

    申请号:CN202210207885.7

    申请日:2022-03-04

    Abstract: 本发明涉及一种移动机器人深度强化学习控制方法,属于机器人智能控制技术领域。在机器人学习行为策略阶段,本发明在最大熵强化学习框架下提出了一种具有历史行为重用的off‑policy似然比策略梯度模型学习算法,用于对移动机器人进行端对端的行为控制。该方法提高了机器人行为学习过程中数据的利用率,从而提高了学习速度和采样效率,节省了机器人与环境的交互成本。同时,在对机器人的行为策略模型进行评估阶段,本发明提出了一种统一的评价网络模型来同时逼近状态值函数和动作值函数,通过该评价网络可以直接给出一个状态和动作的优势函数。相对于使用两个网络分别逼近状态值函数和动作值函数,该评价网络具有学习速度快、能够减小参数累积误差的优势。

    基于Kinect骨骼追踪和无标定视觉伺服的人机协作系统

    公开(公告)号:CN106514667B

    公开(公告)日:2020-12-08

    申请号:CN201611106214.2

    申请日:2016-12-05

    Abstract: 本发明公开了一种基于Kinect骨骼追踪和无标定视觉伺服的人机协作系统,属于人机协作技术领域,它包括:机器人、人机交互控制模块、信息采集模块及智能控制模块;所述人机交互模块包括Kinect和远程控制单元,所述Kinect通过其摄像头采集人体骨骼的位姿信息,并把该位姿信息传输给远程控制单元,远程控制单元再把该位姿信息传递给智能控制模块;所述信息采集模块通过摄像采集机器人在工作台上的具体工作任务场景的信息后,发送给智能控制模块;所述智能控制模块接收到所述位姿信息和图像信息并进行处理后,得到机器人的运动指令,并将该运动指令发送给机器人;本发明通过利用Kinect骨骼追踪技术实现了人体动作对机器人的非接触式控制。

    带有未知过程噪声协方差阵递推估计的卡尔曼滤波方法

    公开(公告)号:CN104202019B

    公开(公告)日:2017-05-10

    申请号:CN201410423093.9

    申请日:2014-08-25

    Abstract: 本发明提供了针对离散时间时不变系统的一种基于递推协方差矩阵估计方法的卡尔曼滤波方法,目的是要解决一类离散时间线性时不变系统中观测噪声协方差矩阵完全未知的情况下的系统状态滤波估计问题。步骤一、利用观测序列{yk}构建新统计序列{ξk};步骤二、计算{ξk}的协方差矩阵递推公式:步骤三、利用观测噪声协方差矩阵与新统计序列协方差矩阵实时估计值Covk(ξ)之间的代数关系,计算过程噪声协方差矩阵估计序列;步骤四、通过f(Q)和过程噪声协方差矩阵Q的关系,计算出协方差矩阵的估计序列步骤五、将过程噪声的协方差矩阵估计序列替代真值代入标准卡尔曼滤波方法中,计算系统实时的状态估计以及状态估计偏差的协方差矩阵。

    基于Kinect骨骼追踪和无标定视觉伺服的人机协作系统

    公开(公告)号:CN106514667A

    公开(公告)日:2017-03-22

    申请号:CN201611106214.2

    申请日:2016-12-05

    Abstract: 本发明公开了一种基于Kinect骨骼追踪和无标定视觉伺服的人机协作系统,属于人机协作技术领域,它包括:机器人、人机交互控制模块、信息采集模块及智能控制模块;所述人机交互模块包括Kinect和远程控制单元,所述Kinect通过其摄像头采集人体骨骼的位姿信息,并把该位姿信息传输给远程控制单元,远程控制单元再把该位姿信息传递给智能控制模块;所述信息采集模块通过摄像采集机器人在工作台上的具体工作任务场景的信息后,发送给智能控制模块;所述智能控制模块接收到所述位姿信息和图像信息并进行处理后,得到机器人的运动指令,并将该运动指令发送给机器人;本发明通过利用Kinect骨骼追踪技术实现了人体动作对机器人的非接触式控制。

    一种基于机器视觉的机器人打磨轨迹规划方法及装置

    公开(公告)号:CN118342505A

    公开(公告)日:2024-07-16

    申请号:CN202410492840.8

    申请日:2024-04-23

    Abstract: 本发明公开了一种基于机器视觉的机器人打磨轨迹规划方法及装置,涉及钢铸件打磨机器人技术领域;通过深度学习技术识别铸件上的标签物,引导机器人到达合适的作业位置,3D相机从5个方位扫描打磨区域并完成表面拼接重建,解决大型钢铸件的细节点云完整重建问题;进而检测重建铸件表面存在的焊疤凸起、焊缝、粗糙面确定待打磨区域,结合工艺需求规划机器人打磨作业轨迹。本发明基于机器视觉感知的方式规划铸件打磨机器人作业轨迹,相比于离线编程或示教方式的轨迹规划,能够有效解决在不确定打磨区域、打磨形状、铸件类型时的轨迹拓展性问题,并能够自适应打磨工艺需要,对解放劳动力、提高生产力并降低成本等方面有积极意义。

    一种基于多智能体强化学习的自动驾驶车辆控制方法

    公开(公告)号:CN116394968A

    公开(公告)日:2023-07-07

    申请号:CN202211546947.3

    申请日:2022-12-05

    Abstract: 本发明涉及一种基于多智能体强化学习的自动驾驶车辆控制方法,属于人工智能和自动驾驶技术领域。针对自动驾驶车辆场景,本方法提出了一个用于AVs的多智能体自适应决策框架。首先考虑乘客的个性化需求,为AVs制定不同的驾驶风格,用于后续决策建模过程中。利用联盟博弈和V2V通信,以每个网联自动驾驶车辆CAV为中心划分多智能体系统,从而构建合作决策区域。然后,基于模型预测控制中的滚动时域,构建了一个深度强化学习决策框架,以实现CAV在合作区域里的运动决策。在完全自动驾驶车辆的场景下,本发明不仅能够保证在高速主干车道上的安全性和效率,而且对于匝道合流区域的安全性、舒适度和效率也能够得到保障。

Patent Agency Ranking