-
公开(公告)号:CN119260748A
公开(公告)日:2025-01-07
申请号:CN202411797260.6
申请日:2024-12-09
Applicant: 天津大学
Abstract: 本发明提供了一种基于结构化动作空间的多机械臂运动规划强化学习训练方法、机械臂运动规划方法。该基于结构化动作空间的多机械臂运动规划强化学习训练方法包括:获取多机械臂的样本状态位姿和针对多机械臂所需执行的样本任务对应的任务目标坐标;将状态位姿和任务目标坐标输入至预设分层强化模型的高层学习模块,得到离散关节动作值;将状态位姿、任务目标坐标和离散关节动作值输入至预设分层强化模型的低层学习模块,得到连续关节动作值;基于离散关节动作值和连续关节动作值调整多机械臂的位姿,得到多机械臂的调整位姿;基于多机械臂的调整位姿确定奖励值;基于奖励值调整预设分层强化模型的低层学习模块,得到经训练的分层强化模型。
-
公开(公告)号:CN119260743A
公开(公告)日:2025-01-07
申请号:CN202411793556.0
申请日:2024-12-09
Applicant: 天津大学
IPC: B25J9/16 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明提供了一种多机械臂协同运动规划方法,可以应用于多机械臂协同控制领域,该方法包括:将多个机械臂各自的动作值和观察值输入动作预测模型的编码器,得到多个机械臂各自的中间动作值和参考中间动作值,观察值表征机械臂执行动作操作后的状态信息,参考中间动作值为多个机械臂均处于预设状态下机械臂的动作值;将多个机械臂各自的中间动作值、参考中间动作值、观察值、部分可观察值分别输入与多个机械臂各自对应解码器,得到多个机械臂各自的目标动作值,部分可观察值为机械臂处于预设状态下的状态信息;控制多个机械臂按照各自的目标动作值运动,以对发动机的缸盖执行装配任务,激励函数包括与装配任务中与各阶段对应的子激励函数。
-
公开(公告)号:CN111650830A
公开(公告)日:2020-09-11
申请号:CN202010428659.2
申请日:2020-05-20
Applicant: 天津大学
Abstract: 本发明公开了一种基于迭代学习的四旋翼飞行器鲁棒跟踪控制方法,包括:对含有时变不确定性的四旋翼飞行器动态微分方程进行分析,建立位置、姿态跟踪误差子系统;获取姿态跟踪误差子系统的状态空间模型,定义位置跟踪误差子系统的耦合不确定性,建立位置跟踪误差子系统状态空间模型;考虑时变、耦合不确定性特性,针对位置跟踪误差子系统、姿态跟踪误差子系统的标称系统,建立考虑耦合不确定项的代价函数;基于代价函数,求解得到最优控制率;基于自适应动态规划方法,设计改进的神经网络权值更新规则,近似求解得到鲁棒跟踪控制器,实现基于迭代学习的近似最优跟踪控制。本发明解决了四旋翼飞行器系统在时变和耦合不确定下的鲁棒跟踪控制问题。
-
公开(公告)号:CN104300863B
公开(公告)日:2017-08-29
申请号:CN201410564140.1
申请日:2014-10-21
Applicant: 天津大学
IPC: H02P21/00
Abstract: 本发明公开了一种变负载永磁同步电机调速的自适应滑模控制方法。对给定的永磁同步电机速度参考值,在负载改变的条件下,本发明对阶跃干扰和连续干扰分别设计了二阶有限时间干扰观测器,估计和补偿负载变化,设计绝对值分数阶滑模面,提出改进幂次趋近律方法,设计了连续滑模控制器。用二阶有限时间干扰观测器和连续滑模控制器构成的自适应滑模控制器进行永磁同步电机的速度调节,使其在负载变化后仍能以参考速度运行,极大的减小了负载变化对电机转速的影响。本发明的方法继承了滑模控制良好的鲁棒性,同时拓展二阶有限时间干扰观测器对阶跃信号进行观测,改善了负载变化情况下转速波动,有效提高了永磁同步电机的驱动能力。
-
公开(公告)号:CN104242769A
公开(公告)日:2014-12-24
申请号:CN201410520288.5
申请日:2014-09-30
Applicant: 天津大学
IPC: H02P21/00
Abstract: 本发明公开了一种基于连续终端滑模技术的永磁同步电机速度复合控制方法。根据矢量控制原理,将永磁同步电机系统解耦成速度环和电流环分别进行控制。对速度环采用复合控制方法。本发明设计了连续终端滑模控制器,作为反馈控制器,使永磁同步电机速度在整个调节过程中都具有较快的响应,并且克服了滑模控制的抖振问题;对速度环干扰项采用二阶有限时间干扰观测器,作为前馈补偿器,实时观测和补偿干扰。当无干扰观测误差时,永磁同步电机转速能够有限时间内到达参考转速,当干扰观测误差有界时,永磁电机转速能够有限时间内到达参考转速的邻域。本发明提出的复合控制方法能够有效调节永磁同步电机转速,具有快的调节速度和好的鲁棒性。
-
公开(公告)号:CN115016286A
公开(公告)日:2022-09-06
申请号:CN202210765784.1
申请日:2022-07-01
Applicant: 天津大学
IPC: G05B13/04
Abstract: 本发明公开了一种非线性工业系统强化学习数据驱动鲁棒控制方法,包括:通过数学等价转换,将最优控制策略转换为数据驱动控制策略,收集系统运行的原始数据,设计数据样本计算模型,收集数据样本到经验池中,直至形成完整数据集合,构建数据驱动控制策略迭代模型;内环迭代中计算数据驱动控制策略,外环迭代中将得到的数据驱动控制策略用于被控系统中;设计新型数据样本存储经验池,在外环迭代控制策略用于被控系统之前,提取并处理数据样本形成不完整数据集合,存储不完整数据集合到经验池,将外环迭代控制策略用于被控系统,收集新的数据样本补充经验池直至形成完整数据集合,从而再次进入双闭环框架中的内环迭代。本发明缓解了相邻数据样本相关性对数据驱动算法收敛性的影响。
-
公开(公告)号:CN111812973B
公开(公告)日:2022-02-22
申请号:CN202010434040.2
申请日:2020-05-21
Applicant: 天津大学
IPC: G05B13/04
Abstract: 本发明针对带有控制约束的离散时间非线性系统,公开了一种离散时间非线性系统的事件触发优化控制方法,在本发明中,引入了一个非二次型性能指标函数以应对控制约束问题,给出了一个事件触发条件并证明了该条件下系统的稳定性,设计了一个模型网络用于识别系统动态以降低算法对系统信息的依赖。算法实现采用GDHP技术,设计了一个评价网络用于近似HJB方程的代价函数及其偏导数信息,一个执行网络用于迭代求解近似最优控制律,这种评价‑执行结构避免了直接求解系统的HJB方程;此外,采用事件触发的方式对系统进行控制决策能够有效减少计算量,节约系统计算资源。
-
公开(公告)号:CN111367180B
公开(公告)日:2022-02-22
申请号:CN202010256620.7
申请日:2020-04-02
Applicant: 天津大学
IPC: G05B13/04
Abstract: 本发明公开了一种基于动态事件触发的切换线性系统H_infinity控制方法,主要包括:在切换系统中引入动态事件触发控制,定义状态误差函数,构造切换系统的状态反馈误差系统;针对构造的切换系统状态误差方程,应用分段Lyapunov函数,并基于平均驻留时间分方法得到使该切换线性系统稳定的切换信号和使得该切换线性系统满足H_infinity控制性能指标的控制器存在的充分条件,该充分条件为一矩阵不等式;将该矩阵不等式转换为线性矩阵不等式,求解该线性矩阵不等式,得到该切换线性系统中所有子系统的状态反馈增益。本发明提供的设计方案在保证切换线性系统性能的同时,能有效减少控制信号传输的次数,有效节约通信资源。
-
公开(公告)号:CN111812973A
公开(公告)日:2020-10-23
申请号:CN202010434040.2
申请日:2020-05-21
Applicant: 天津大学
IPC: G05B13/04
Abstract: 本发明针对带有控制约束的离散时间非线性系统,公开了一种离散时间非线性系统的事件触发优化控制方法,在本发明中,引入了一个非二次型性能指标函数以应对控制约束问题,给出了一个事件触发条件并证明了该条件下系统的稳定性,设计了一个模型网络用于识别系统动态以降低算法对系统信息的依赖。算法实现采用GDHP技术,设计了一个评价网络用于近似HJB方程的代价函数及其偏导数信息,一个执行网络用于迭代求解近似最优控制律,这种评价-执行结构避免了直接求解系统的HJB方程;此外,采用事件触发的方式对系统进行控制决策能够有效减少计算量,节约系统计算资源。
-
公开(公告)号:CN115016286B
公开(公告)日:2024-11-01
申请号:CN202210765784.1
申请日:2022-07-01
Applicant: 天津大学
IPC: G05B13/04
Abstract: 本发明公开了一种非线性工业系统强化学习数据驱动鲁棒控制方法,包括:通过数学等价转换,将最优控制策略转换为数据驱动控制策略,收集系统运行的原始数据,设计数据样本计算模型,收集数据样本到经验池中,直至形成完整数据集合,构建数据驱动控制策略迭代模型;内环迭代中计算数据驱动控制策略,外环迭代中将得到的数据驱动控制策略用于被控系统中;设计新型数据样本存储经验池,在外环迭代控制策略用于被控系统之前,提取并处理数据样本形成不完整数据集合,存储不完整数据集合到经验池,将外环迭代控制策略用于被控系统,收集新的数据样本补充经验池直至形成完整数据集合,从而再次进入双闭环框架中的内环迭代。本发明缓解了相邻数据样本相关性对数据驱动算法收敛性的影响。
-
-
-
-
-
-
-
-
-