-
公开(公告)号:CN118642354A
公开(公告)日:2024-09-13
申请号:CN202410216374.0
申请日:2024-02-27
Applicant: 清华大学 , 财拓云计算(上海)有限公司
IPC: G05B13/04
Abstract: 本发明提供一种冷源温控和能量优化的智能体离线层次化强化学习方法,包括:采集冷源系统以及冷源单元的历史运行数据,进行数据处理生成运行历史数据集;基于冷源系统,通过自动负载工作库目标从无动作的离线强化学习方法学习到状态动作价值函数,基于价值函数提取高层策略进行冷源系统的控制;基于冷源单元,通过概率动力学模型进行学习,引入判别器,将学习过程耦合纳入所述判别器的输入建立合作信息共享,确定低层策略的损失函数,建立低层策略进行冷源单元的控制;将冷源系统的高层策略与冷源单元的低层策略部署至冷却系统,对冷却系统进行在线优化控制。本发明解决了现有冷却系统优化控制数据效率低、分布偏移,高维状态空间难处理的问题。
-
公开(公告)号:CN113806930B
公开(公告)日:2024-01-30
申请号:CN202111047135.X
申请日:2021-09-08
Applicant: 清华大学
IPC: G06F30/20
Abstract: 本公开提出一种白盒与黑盒离散事件系统协同仿真的时序推进方法及装置,属于协同仿真时序一致技术领域。其中,所述方法包括:根据离散事件系统中各白盒子系统的当前步长确定当前安全时间距离和所述各白盒子系统的当前仿真时间;根据所述当前安全时间距离和所述离散事件系统中各黑盒子系统的当前仿真时间,计算所述各黑盒子系统的当前安全仿真时间;根据所述各白盒子系统的当前仿真时间和所述各黑盒子系统的当前安全仿真时间,确定仿真中下一个推进的子系统;按照所述下一个推进的子系统的事件表推进仿真。本公开克服了对黑白盒模型协同仿真中乐观推进策略的不足,引入一种改进的时序推进方法,在尽量规避黑盒模型仿真回滚的情况下实现时序一致性。
-
公开(公告)号:CN115114768A
公开(公告)日:2022-09-27
申请号:CN202210582458.7
申请日:2022-05-26
Applicant: 清华大学
IPC: G06F30/20 , G06F30/15 , G06F119/14
Abstract: 本发明公开了一种复杂产品多分辨率模型跨层次切换控制方法及装置,该方法包括:根据仿真任务,分别确定路面系统模型和车辆系统模型的系统结构状态;其中,路面系统模型包括路面模型,车辆系统模型包括轮胎模型和车体模型;分别构建路面系统模型和车辆系统模型的模型函数,对模型函数进行计算,根据计算结果确定路面模型、轮胎模型和车体模型对应的模型分辨率状态;根据系统结构状态和对应的模型分辨率状态的预设变化状态,进行下次仿真任务。该方法对系统结构状态和模型分辨率状态分别建立描述机制,并提出系统分辨率的控制机制,可满足系统的整体性需求,在保证仿真精度的同时,提升仿真效率,节省所需的仿真资源。
-
公开(公告)号:CN115099037B
公开(公告)日:2024-11-29
申请号:CN202210744890.1
申请日:2022-06-27
Applicant: 清华大学
IPC: G06F30/20 , G09B9/04 , G06F119/14
Abstract: 本发明提供一种动力学模型支持的有偏好模仿学习方法及系统包括:获取自动驾驶训练所需要的训练样本集,其中,所述训练样本包含离线专家数据集和动力学模型数据集;通过预设的判别器输出加权值训练驾驶模仿策略模型;通过训练后的驾驶模仿策略模型,对自动驾驶车辆进行模仿训练。本发明解决了现有模仿学习可用专家数据有限、训练成本高、效率低的缺陷,以实现快速高效的有偏好模仿学习。
-
公开(公告)号:CN113806930A
公开(公告)日:2021-12-17
申请号:CN202111047135.X
申请日:2021-09-08
Applicant: 清华大学
IPC: G06F30/20
Abstract: 本公开提出一种白盒与黑盒离散事件系统协同仿真的时序推进方法及装置,属于协同仿真时序一致技术领域。其中,所述方法包括:根据离散事件系统中各白盒子系统的当前步长确定当前安全时间距离和所述各白盒子系统的当前仿真时间;根据所述当前安全时间距离和所述离散事件系统中各黑盒子系统的当前仿真时间,计算所述各黑盒子系统的当前安全仿真时间;根据所述各白盒子系统的当前仿真时间和所述各黑盒子系统的当前安全仿真时间,确定仿真中下一个推进的子系统;按照所述下一个推进的子系统的事件表推进仿真。本公开克服了对黑白盒模型协同仿真中乐观推进策略的不足,引入一种改进的时序推进方法,在尽量规避黑盒模型仿真回滚的情况下实现时序一致性。
-
公开(公告)号:CN112711859A
公开(公告)日:2021-04-27
申请号:CN202110040873.5
申请日:2021-01-13
Applicant: 清华大学
Abstract: 本发明提出一种基于主题消息总线的信息物理异构模型集成装配系统,属于信息物理系统智能控制技术领域。该系统包括:物理设备层,主题消息总线层,智能控制层以及仿真层;其中,所述物理设备层包含若干个工位单元,每个工位单元包括一台上位机和连接该上位机的若干台物理设备;每台物理设备通过所在工位单元的上位机与主题主题消息总线层连接,主题消息总线层、智能控制层和仿真层两两相互连接。该系统通过主题消息总线层将智能制造中信息物理系统的物理设备、工位、虚拟仿真模型,智能控制中心等异构模型的统一互联集成。本发明实时性高,兼容性强,可交互优化装配工艺,操作友好,可以应用于工业领域复杂产品的装配产线及其相关设备。
-
公开(公告)号:CN114986512B
公开(公告)日:2024-12-31
申请号:CN202210744893.5
申请日:2022-06-27
Applicant: 清华大学 , 毫末智行科技有限公司
IPC: B25J9/16
Abstract: 本发明提供一种动力学模型支持的双重有偏好模仿学习方法及系统,包括:获取自动驾驶训练所需要的训练样本集,其中,所述训练样本包含离线专家数据集、离线无奖励标签数据集和动力学模型数据集;通过预设的第一判别器输出数据与专家数据的接近程度和预设的第二判别器输出数据与真实数据的接近程度构建损失函数,训练驾驶模仿策略模型;通过训练后的驾驶模仿策略模型,对自动驾驶车辆进行模仿训练。本发明解决了现有模仿训练中可用专家数据量少、训练效率低的缺陷,以实现快速高效的有偏好模仿学习。
-
公开(公告)号:CN118504168A
公开(公告)日:2024-08-16
申请号:CN202410681856.3
申请日:2024-05-29
Applicant: 清华大学
IPC: G06F30/17 , G06F30/27 , G06N3/045 , G06N3/0455
Abstract: 本发明提供一种基于悬臂结构数字孪生体的灰盒模型构建方法及系统,包括:获取悬臂结构的关节变量数据;将所述关节变量数据通过灰度变换转换为关节转角三角函数的全排列向量序列;将所述全排列向量序列输入至预设的基于时序序列建立的数据模型;通过对所述数据模型添加多头注意力机制捕捉全排列向量序列中不同的关系和特征,输出悬臂结构的末端位姿,完成灰盒模型构建。本发明解决了现有悬臂结构孪生体仿真模型适应性差、难以兼顾精确度和实时性的问题。
-
公开(公告)号:CN111191867B
公开(公告)日:2023-07-21
申请号:CN201811376565.4
申请日:2018-11-19
Applicant: 国网经济技术研究院有限公司 , 清华大学 , 国网江苏省电力有限公司经济技术研究院 , 国网江苏省电力有限公司
IPC: G06Q10/0637 , G06Q50/06
Abstract: 本发明属于供电网格的构建技术领域,公开了一种电力系统复杂网络的可靠性评估方法,把电力系统抽象成为复杂网络模型,把电力系统的母线、发电站、连接线路和变压器等元件都纳入复杂网络考虑其可靠性,把电力系统的母线、发电站等视为节点,把电力系统的连接线路、变压器等视为边,采用复杂网络节点、边及路径的可靠性加权度指标模型分析评估电力系统复杂网络的节点的可靠性,这些指标不仅体现了节点、支路、电气路径在拓扑连接关系中的重要性,更体现了这些电气元件自身的可靠度。本发明可应用于电网规划及运行阶段,对分析电网系统薄弱环节,提升电网可靠性,继而指导后期升级改造,具有重要意义。
-
公开(公告)号:CN112765766B
公开(公告)日:2022-11-04
申请号:CN202011495553.0
申请日:2020-12-17
Applicant: 清华大学
Abstract: 本发明提出一种动态交互的细粒度离散事件系统时序推进方法,属于协同仿真时序一致技术领域。本发明对于基于事件的时序推进算法进行改进,通过解耦事件响应与交互处理两个部分,设计交互表实现对交互的动态管理,形成一种粒度更细的交互方式。在本发明中,对发生事件设计了合理而高效的响应逻辑,在每个事件发生的时间点上,对被交互子系统状态进行检测,并据此做出事件响应决策;同时设计了与之相对应的交互处理与子系统仿真推进逻辑,引入工作点保存进而实现仿真回退,使得离散事件系统之间产生的交互更加精准,仿真精度更高。本发明所提出的时序推进方式更适合随机性较强、交互较复杂的离散事件系统协同仿真。
-
-
-
-
-
-
-
-
-