-
公开(公告)号:CN114756025B
公开(公告)日:2024-07-23
申请号:CN202210344861.6
申请日:2022-04-02
Applicant: 天津大学
IPC: G05D1/43 , G05D1/644 , G05D1/247 , G05D109/10
Abstract: 本发明公开了一种自主小车巡航控制方法及装置,用以解决自主小车系统的自适应巡航控制问题;该方法包括:构建基于微分博弈的巡航跟踪控制模型;利用评价网络结构获得基于事件触发的控制策略;确定基于分布式动态触发的事件触发规则;将训练获得的控制策略经误差变换后实现自适应巡航控制;装置包括:电源电池组、动力组件、控制器、存储器、事件触发器与通讯组件;本发明能帮助自主小车更迅速地、更准确地跟踪到巡航状态,提高强化学习效率,减少控制系统的通讯量和计算量并有效改善巡航装置的耗能情况。
-
公开(公告)号:CN116826762A
公开(公告)日:2023-09-29
申请号:CN202311092375.0
申请日:2023-08-29
Applicant: 天津大学
IPC: H02J3/12 , G06F30/27 , G06N3/0464 , G06N3/08 , G06F113/04
Abstract: 本发明提供了一种智能配电网电压安全控制方法、装置、设备及其介质。该方法包括:从智能配电网中实时获取各个发电节点的观测量,其中,智能配电网包括n个发电节点,n为大于等于2的整数,观测量包括:节点电压值、有功功率值以及无功功率值;针对每个发电节点,重复执行下述操作:在确定节点电压值不在预设区间内的情况下,利用智能体,对节点电压值进行调控,得到目标调控策略,以使智能配电网的电压安全稳定运行,其中,智能体是由具有单调约束的策略网络、评估网络和目标评估网络组成的,策略网络用于生成初始调控策略,评估网络和目标评估网络均用于对初始调控策略进行优化,得到目标调控策略。
-
公开(公告)号:CN116094862A
公开(公告)日:2023-05-09
申请号:CN202211368942.6
申请日:2022-11-03
Applicant: 天津大学
Abstract: 本发明涉及一种基于量子多元宇宙协同进化的无标度物联网鲁棒组网方法,通过引入量子比特来代替经典比特作为拓扑优化的载体,通过量子比特把无标度网络拓扑编码为量子染色体,并使用量子门、量子测量和量子多元宇宙协同等操作来完成拓扑鲁棒性的优化过程,以在有限的进化代数下探索更多样的进化方向,进而跳出局部最优,解决了拓扑优化由于基因多样性丧失而陷入局部最优解的问题;以及通过多元宇宙之间的协同机制达到在保证进化收敛效率的基础上进一步提高无标度物联网拓扑对恶意攻击的鲁棒性。
-
公开(公告)号:CN114756025A
公开(公告)日:2022-07-15
申请号:CN202210344861.6
申请日:2022-04-02
Applicant: 天津大学
IPC: G05D1/02
Abstract: 本发明公开了一种自主小车巡航控制方法及装置,用以解决自主小车系统的自适应巡航控制问题;该方法包括:构建基于微分博弈的巡航跟踪控制模型;利用评价网络结构获得基于事件触发的控制策略;确定基于分布式动态触发的事件触发规则;将训练获得的控制策略经误差变换后实现自适应巡航控制;装置包括:电源电池组、动力组件、控制器、存储器、事件触发器与通讯组件;本发明能帮助自主小车更迅速地、更准确地跟踪到巡航状态,提高强化学习效率,减少控制系统的通讯量和计算量并有效改善巡航装置的耗能情况。
-
公开(公告)号:CN112445132A
公开(公告)日:2021-03-05
申请号:CN201910818742.8
申请日:2019-08-30
Applicant: 天津大学
IPC: G05B13/04
Abstract: 本发明公开了一种多智能体系统最优状态一致性控制方法,该方法首先构造状态邻域跟踪误差及跟踪误差系统,将多智能体系统的最优状态一致性控制问题转化为误差系统的误差稳定控制问题;然后针对邻域跟踪误差系统,定义误差系统的代价函数,给出全局纳什均衡解;并引入Q函数,使用Q函数重构代价函数,推导Q函数贝尔曼方程并求解最优控制;依据Q函数贝尔曼方程及最优控制方程,设计基于策略迭代的Q‑learning算法,并用最小二乘法迭代地求解每个智能体的最优控制。本方法不要求知道系统的动态信息,避免了直接求解耦合哈密顿‑雅可比‑贝尔曼方程;算法实现采用最小二乘法,得到的控制解为解析解,避免了近似误差的出现,有效提高了最优控制的精准度。
-
公开(公告)号:CN112445131A
公开(公告)日:2021-03-05
申请号:CN201910818741.3
申请日:2019-08-30
Applicant: 天津大学
IPC: G05B13/04
Abstract: 本发明公开了一种线性系统自适应最优跟踪控制方法,首先将系统的跟踪控制转化为增广系统的稳定性控制,然后针对增广系统,引入Q函数重构系统性能指标函数,建立基于控制依赖二次启发式规划的系统目标方程;再设计一个模型网络来近似估计系统的下一时刻的状态x(k+1)及系统矩阵A和B,对系统进行辨识;在模型网络辨识器的基础上,构建基于控制依赖二次启发式规划的Q‑learning算法,迭代获得系统的近似最优控制律。本发明在系统动态未知的情况下求解的最优控制,这使得系统的最优跟踪问题在未知精确系统模型情况下也能被解决,且有效提高了最优控制的精准度。
-
公开(公告)号:CN109274106A
公开(公告)日:2019-01-25
申请号:CN201811077924.6
申请日:2018-09-16
Applicant: 天津大学
IPC: H02J3/24
Abstract: 本发明提供一种基于电动汽车集群的智能电网频率控制方法,包含初级控制器和电动汽车控制器;初级控制器用于控制发电机的输出,电动汽车控制器由自适应辅助控制器和PI基础控制器构成,用于控制集群的电动汽车的充电功率和放电功率,步骤是:1)测量获取智能电网基准系统在频率控制时所需的相关参数;2)使用滑模控制方法设计初级控制器来控制发电机功率的输出;3)使用自适应动态规划方法构建自适应辅助控制器;4)构建PI基础控制器,并基于步骤3)中的自适应辅助控制器的自适应控制信号,两者相加得到电动汽车控制器最终的输出信号;5)将初级控制器和电动汽车控制器同时应用到智能电网,并基于频率偏差分配系数调整相应的频率偏差。
-
公开(公告)号:CN119260748A
公开(公告)日:2025-01-07
申请号:CN202411797260.6
申请日:2024-12-09
Applicant: 天津大学
Abstract: 本发明提供了一种基于结构化动作空间的多机械臂运动规划强化学习训练方法、机械臂运动规划方法。该基于结构化动作空间的多机械臂运动规划强化学习训练方法包括:获取多机械臂的样本状态位姿和针对多机械臂所需执行的样本任务对应的任务目标坐标;将状态位姿和任务目标坐标输入至预设分层强化模型的高层学习模块,得到离散关节动作值;将状态位姿、任务目标坐标和离散关节动作值输入至预设分层强化模型的低层学习模块,得到连续关节动作值;基于离散关节动作值和连续关节动作值调整多机械臂的位姿,得到多机械臂的调整位姿;基于多机械臂的调整位姿确定奖励值;基于奖励值调整预设分层强化模型的低层学习模块,得到经训练的分层强化模型。
-
公开(公告)号:CN119260743A
公开(公告)日:2025-01-07
申请号:CN202411793556.0
申请日:2024-12-09
Applicant: 天津大学
IPC: B25J9/16 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明提供了一种多机械臂协同运动规划方法,可以应用于多机械臂协同控制领域,该方法包括:将多个机械臂各自的动作值和观察值输入动作预测模型的编码器,得到多个机械臂各自的中间动作值和参考中间动作值,观察值表征机械臂执行动作操作后的状态信息,参考中间动作值为多个机械臂均处于预设状态下机械臂的动作值;将多个机械臂各自的中间动作值、参考中间动作值、观察值、部分可观察值分别输入与多个机械臂各自对应解码器,得到多个机械臂各自的目标动作值,部分可观察值为机械臂处于预设状态下的状态信息;控制多个机械臂按照各自的目标动作值运动,以对发动机的缸盖执行装配任务,激励函数包括与装配任务中与各阶段对应的子激励函数。
-
公开(公告)号:CN117639093A
公开(公告)日:2024-03-01
申请号:CN202311527321.2
申请日:2023-11-16
Applicant: 国网天津市电力公司电力科学研究院 , 国网天津市电力公司 , 国家电网有限公司 , 天津大学
Abstract: 本发明涉及一种基于深度强化学习的区域电网多目标区间优化调度方法,包括以下步骤:构建区域电网多目标优化调度模型;基于建立的区域电网多目标优化调度模型,构建区域电网多目标区间优化调度模型;基于双延迟深度确定性策略梯度算法训练区域电网多目标区间优化调度模型智能体;基于深度强化学习算法和建立的智能体进行区域电网多目标区间优化调度。本发明够解决含新能源的局部电网用电、发电随机性和不确定性问题。
-
-
-
-
-
-
-
-
-