-
公开(公告)号:CN106354010A
公开(公告)日:2017-01-25
申请号:CN201610868410.7
申请日:2016-09-29
Applicant: 中国科学院自动化研究所
IPC: G05B13/04
CPC classification number: G05B13/042
Abstract: 本发明公开了一种自适应最优控制方法和自适应最优控制系统。其中,该方法可以包括利用神经网络确定上行迭代性能指标函数;接着,判断上行迭代性能指标函数是否收敛,并根据收敛结果确定上行最优性能指标函数;然后,利用神经网络确定下行迭代性能指标函数;接着,判断下行迭代性能指标函数是否收敛,并根据收敛结果确定下行最优性能指标函数;再判断上行最优性能指标函数与下行最优性能指标函数是否相等;最后,在上行最优性能指标函数与下行最优性能指标函数相等的情况下,确定控制系统达到最优。本发明实施例只需通过上行函数和下行函数相等与否来判断鞍点的存在性,解决了如何使得控制系统稳定的技术问题。
-
公开(公告)号:CN105843037A
公开(公告)日:2016-08-10
申请号:CN201610221709.3
申请日:2016-04-11
Applicant: 中国科学院自动化研究所
IPC: G05B13/02
CPC classification number: G05B13/027
Abstract: 本发明公开了一种基于Q学习的智能楼宇温度控制方法,包括:相关参数初始化;开启全局迭代,初始化评价网络权值;开启局部迭代,利用Q学习算法训练评价网络,修正网络权值,其中评价网络用来近似最优性能指标函数,并利用该评价网络权值评测当前温度控制系统的性能,通过执行流程选择最优控制策略,最小化一次全局迭代的总成本;判断当前局部迭代是否完成,若否,则返回局部迭代,否则更新迭代性能指标函数和控制律,以获得最优解;判断当前全局迭代是否满足收敛精度,若否,则返回全局迭代,否则根据最优性能指标函数获得最优控制策略,并计算总成本。由此,本发明可以不断地学习、调整和适应外界环境在未来的不确定的变化以提高系统的性能。
-
公开(公告)号:CN105843037B
公开(公告)日:2019-05-10
申请号:CN201610221709.3
申请日:2016-04-11
Applicant: 中国科学院自动化研究所
IPC: G05B13/02
Abstract: 本发明公开了一种基于Q学习的智能楼宇温度控制方法,包括:相关参数初始化;开启全局迭代,初始化评价网络权值;开启局部迭代,利用Q学习算法训练评价网络,修正网络权值,其中评价网络用来近似最优性能指标函数,并利用该评价网络权值评测当前温度控制系统的性能,通过执行流程选择最优控制策略,最小化一次全局迭代的总成本;判断当前局部迭代是否完成,若否,则返回局部迭代,否则更新迭代性能指标函数和控制律,以获得最优解;判断当前全局迭代是否满足收敛精度,若否,则返回全局迭代,否则根据最优性能指标函数获得最优控制策略,并计算总成本。由此,本发明可以不断地学习、调整和适应外界环境在未来的不确定的变化以提高系统的性能。
-
公开(公告)号:CN106227043A
公开(公告)日:2016-12-14
申请号:CN201610815563.5
申请日:2016-09-09
Applicant: 中国科学院自动化研究所
IPC: G05B13/04
CPC classification number: G05B13/042
Abstract: 本发明公开了一种自适应最优控制方法。其中,将控制系统的状态空间进行子空间划分;基于局部迭代算法,确定初始性能指标函数;判断控制系统的当前状态是否处于现行子空间中;若是,则根据判断结果优化当前状态下的动作;否则,保持上一时刻的动作,并根据状态所属子空间,确定初始迭代控制律以及初始迭代性能指标函数;接着,针对任一迭代,利用神经网络确定迭代性能指标函数和迭代控制律;再确定相邻两次迭代评价网络是否满足一定的收敛条件;最后,将得到的性能指标函数和控制律确定为最优性能指标函数和最优控制律。本发明实施例加快了收敛速度,实现了在系统状态稳定的情况下性能指标函数达到最小的效果。
-
-
-