-
公开(公告)号:CN114222952A
公开(公告)日:2022-03-22
申请号:CN202080057129.X
申请日:2020-05-13
Applicant: 三菱电机株式会社
Abstract: 提供了一种用于控制机器的操作的系统,该机器经受机器的连续状态空间中的状态约束并且经受机器的连续控制输入空间中的控制输入约束。该设备包括:输入接口,输入接口用于接受指示机器状态的数据;存储器,存储器被配置为存储优化问题和控制策略,优化问题用于计算满足状态约束的状态和动作对的安全裕度,控制策略将机器的在控制不变集合CIS内的状态映射到满足控制输入约束的控制输入;以及处理器,处理器被配置为迭代地执行强化学习RL算法以联合地控制机器并更新控制策略。
-
公开(公告)号:CN114222952B
公开(公告)日:2024-08-13
申请号:CN202080057129.X
申请日:2020-05-13
Applicant: 三菱电机株式会社
Abstract: 提供了一种用于控制机器的操作的系统,该机器经受机器的连续状态空间中的状态约束并且经受机器的连续控制输入空间中的控制输入约束。该设备包括:输入接口,输入接口用于接受指示机器状态的数据;存储器,存储器被配置为存储优化问题和控制策略,优化问题用于计算满足状态约束的状态和动作对的安全裕度,控制策略将机器的在控制不变集合CIS内的状态映射到满足控制输入约束的控制输入;以及处理器,处理器被配置为迭代地执行强化学习RL算法以联合地控制机器并更新控制策略。
-