-
公开(公告)号:CN113498523A
公开(公告)日:2021-10-12
申请号:CN201980093505.8
申请日:2019-10-02
Applicant: 三菱电机株式会社
Abstract: 受到状态约束和控制输入约束的机器被控制,而控制策略是从机器的操作期间收集的数据中学习的。为了确保满足约束条件,机器的状态被维持在满足约束的约束容许不变集(CAIS)内,并利用将CAIS内的系统状态映射到满足控制输入约束的控制输入的相应的控制策略来控制机器。使用约束策略迭代来控制机器,其中,受约束策略评估更新CAIS和值函数,并且受约束策略改进更新了控制策略,该控制策略根据更新后的CAIS和相应的更新后的值函数改进了操作的成本函数。
-
公开(公告)号:CN113498523B
公开(公告)日:2024-04-30
申请号:CN201980093505.8
申请日:2019-10-02
Applicant: 三菱电机株式会社
Abstract: 受到状态约束和控制输入约束的机器被控制,而控制策略是从机器的操作期间收集的数据中学习的。为了确保满足约束条件,机器的状态被维持在满足约束的约束容许不变集(CAIS)内,并利用将CAIS内的系统状态映射到满足控制输入约束的控制输入的相应的控制策略来控制机器。使用约束策略迭代来控制机器,其中,受约束策略评估更新CAIS和值函数,并且受约束策略改进更新了控制策略,该控制策略根据更新后的CAIS和相应的更新后的值函数改进了操作的成本函数。
-