专利检索 ap:("清华大学" OR "南方电网科学研究院有限责任公司") AND inv:"郭天宇" 第 1 页

1.

发明公开
一种被控系统运行调度的高效率强化学习方法及装置审中-实审

公开(公告)号：CN118674066A

公开(公告)日：2024-09-20

申请号：CN202410798963.4

申请日：2024-06-20

申请人： 清华大学 , 南方电网科学研究院有限责任公司

发明人： 贾庆山 , 郭琦 , 黄立滨 , 余佳微 , 郭天宇 , 卢远宏 , 郭海平 , 涂亮

IPC分类号： G06N20/00 , G06F17/18 , G06Q10/067 , G06Q10/0631 , G06Q50/06

摘要： 本发明涉及强化学习领域，提供了一种被控系统运行调度的高效率强化学习方法及装置，方法包括：对被控系统的各状态‑动作对进行采样，根据采样结果确定各状态下各动作的动作类型、Q因子样本方差及已消耗样本总量；利用采样数据分配算法确定各状态下各动作目标样本量；根据各动作目标样本量与各动作已消耗样本量，确定各动作补充采样数量；根据各动作补充采样数量进行补充采样，利用补充采样的仿真结果重新确定各动作的动作类型、各状态‑动作对的Q因子样本方差；调整已消耗采样总量，判断已消耗样本总量满足动作采样数量约束条件，若是，则输出各状态下观测到的最优动作，本发明能够区分各状态动作的重要性，提升采样效率及优化策略性能。

2.

发明公开
一种被控系统群的运行策略协同优化方法及装置审中-实审

公开(公告)号：CN118674109A

公开(公告)日：2024-09-20

申请号：CN202410798959.8

申请日：2024-06-20

申请人： 清华大学 , 南方电网科学研究院有限责任公司

发明人： 贾庆山 , 郭琦 , 黄立滨 , 余佳微 , 郭天宇 , 卢远宏 , 郭海平 , 涂亮

IPC分类号： G06Q10/04 , G06Q10/0631 , G06Q10/067 , G06Q50/06 , G06F17/18 , G06N20/00

摘要： 本发明涉及运行策略优化领域，提供了一种被控系统群的运行策略协同优化方法及装置，方法包括：根据仿真结果确定各动作的Q因子样本方差、各最优动作与非最优动作的Q因子融合值的性能差别以及已消耗样本总量；利用采样数据分配算法对上述量进行分析得到各动作目标样本量；根据各动作目标样本量与各动作已消耗样本量确定各动作补充采样量；根据补充采样量进行补充采样，利用补充仿真结果重新确定各动作的Q因子样本方差、性能差别以及已消耗样本总量；调整已消耗样本总量，判断已消耗样本总量是否小于预设总采样量，若是重新计算目标样本量及之后步骤，若否输出最优动作。本发明协同使用动作一致性的被控系统的运行数据，能够提升优化效率及性能。

3.

发明公开
一种面向单约束待控系统的在线约束强化学习方法及装置审中-实审

公开(公告)号：CN118674067A

公开(公告)日：2024-09-20

申请号：CN202410804230.7

申请日：2024-06-20

申请人： 清华大学 , 南方电网科学研究院有限责任公司

发明人： 贾庆山 , 郭琦 , 黄立滨 , 余佳微 , 郭天宇 , 卢远宏 , 郭海平 , 涂亮

IPC分类号： G06N20/00 , G06F17/18 , G06Q10/067 , G06Q10/0631 , G06Q50/06

摘要： 本发明提供了一种面向单约束待控系统的在线约束强化学习方法及装置，包括：按照预设采样量对各动作的仿真结果进行采样，根据采样的仿真结果确定观测的最优动作、可行动作及不可行动作；计算各可行动作及最优动作的Q因子和样本方差、各不可行动作的约束函数QH因子及样本方差；利用采样数据分配算法得到各动作目标样本量；根据各动作目标样本量确定各动作补充采样量；利用补充采样的仿真结果重新确定可行动作及最优动作的Q因子和样本方差、各不可行动作的约束函数QH因子及样本方差；调整已消耗采样总量，判断已消耗样本总量是否满足动作采样量约束条件，若是，输出最优动作至待控系统，本发明能够提升优化策略性能。

4.

发明公开
一种被控系统运行调度的监督强化学习方法及装置审中-实审

公开(公告)号：CN118674068A

公开(公告)日：2024-09-20

申请号：CN202410804234.5

申请日：2024-06-20

申请人： 清华大学 , 南方电网科学研究院有限责任公司

发明人： 贾庆山 , 郭琦 , 黄立滨 , 余佳微 , 郭天宇 , 卢远宏 , 郭海平 , 涂亮

IPC分类号： G06N20/00 , G06F17/18 , G06Q10/067 , G06Q10/0631 , G06Q50/06

摘要： 本发明涉及强化学习领域，提供了一种被控系统运行调度的监督强化学习方法及装置，包括：确定各状态‑动作对的Q因子、Q因子样本方差以及已消耗样本总量；计算各状态下各非观测最优动作的重要性，将重要性排名前△M个非观测最优动作发送至监督者；调整已消耗采样总量，利用采样数据分配算法对各状态‑动作对的Q因子样本方差及已消耗样本总量进行分析得到各状态下各动作目标样本量；确定各动作补充采样数量；根据各动作补充采样数量进行补充采样，利用补充采样结果重新确定之前的步骤；判断已消耗样本总量满足动作采样数量约束条件，若是，则输出各状态下观测到的最优动作，本发明能够将监督者的监督与采样数据融合起来，提升学习效率及性能。

5.

发明公开
一种面向多约束被控系统的在线强化学习方法及装置审中-实审

公开(公告)号：CN118674065A

公开(公告)日：2024-09-20

申请号：CN202410798671.0

申请日：2024-06-20

申请人： 清华大学 , 南方电网科学研究院有限责任公司

发明人： 贾庆山 , 江锐城 , 郭琦 , 黄立滨 , 余佳微 , 郭天宇 , 卢远宏 , 郭海平 , 涂亮

IPC分类号： G06N20/00 , G06F17/18 , G06Q10/067 , G06Q10/0631 , G06Q50/06

摘要： 本发明涉及强化学习领域，提供了一种面向多约束被控系统的在线强化学习方法及装置，方法包括：对动作集合中各动作按预设采样量采样，根据采样结果确定各动作的Q因子的方差、各动作激活约束条件的QH因子的方差及已消耗采样量；根据各动作的已消耗采样量及预设采样增量计算已消耗样本总量；利用采样数据分配算法对上述量进行分析得到各动作的目标样本量；确定各动作补充采样量；根据各动作补充采样量进行补充采样，利用补充采样结果重新确定上述量；调整已消耗采样总量，判断已消耗样本总量是否小于预设总采样量，若否输出该状态的最优动作至被控系统。本发明适用于多约束被控系统，考虑了各约束条件的采样量分配，提高控制策略确定效率。

6.

发明授权
一种电磁暂态实时仿真通信组件的评测方法、装置和设备有权

公开(公告)号：CN116915676B

公开(公告)日：2024-09-06

申请号：CN202310859079.2

申请日：2023-07-13

申请人： 南方电网科学研究院有限责任公司

发明人： 郭琦 , 郭天宇 , 郭海平 , 黄立滨 , 卢远宏 , 张杰 , 涂亮

IPC分类号： H04L43/103 , H04L43/16 , H04L43/087 , H04L43/50

摘要： 本发明公开了一种电磁暂态实时仿真通信组件的评测方法、装置和设备，通过在分布式互联架构的电磁暂态实时仿真系统中每一个计算节点的内存上随机生成任意小样本数据，通过操作系统启动该测试程序将数据从分布式互联架构中的任意1个节点以广播方式发送至其余任意节点中，其中每一个发送准备、发送就绪、接收就绪、接收完成步骤均获取相应时间戳。测试程序可测试不低于100万次以上，通过大量的测试及其结果的分析，可以对分布式互联架构的电磁暂态实时仿真系统通信组件的抖动性能进行精准测试，有效识别其中存在的异常值，为整体系统的性能调优、调试提供参考依据和改进建议。

7.

发明公开
录波数据文件的生成方法、装置、存储介质及计算机设备审中-实审

公开(公告)号：CN118427174A

公开(公告)日：2024-08-02

申请号：CN202410679907.9

申请日：2024-05-29

申请人： 南方电网科学研究院有限责任公司 , 中国南方电网有限责任公司

发明人： 郭琦 , 郭天宇 , 黄立滨 , 郭海平 , 卢远宏 , 张杰 , 胡斌江 , 罗辉 , 张竞月 , 涂亮

IPC分类号： G06F16/172

摘要： 本申请提供了一种录波数据文件的生成方法、装置、存储介质及计算机设备中，可用于生成特定格式的录波数据文件。在该特定格式的录波数据文件中，录波元信息记录有录波数据对应的录波标识、该录波数据文件记录的录波数据行的实际行数以及该录波数据文件对应的最小周期标识。如此，可根据每个录波数据文件的录波标识、最小周期标识和实际行数，将对应于同一录波标识的多个录波数据文件组合为完整的录波数据，从而可支持分文件存储录波数据，提高了可扩展性。

8.

发明授权
电力实时仿真中的步长同步校准方法、装置及相关设备有权

公开(公告)号：CN115459897B

公开(公告)日：2024-06-04

申请号：CN202211077526.0

申请日：2022-09-02

申请人： 南方电网科学研究院有限责任公司

发明人： 卢远宏 , 郭琦 , 郭海平 , 郭天宇 , 张杰 , 黄立滨

IPC分类号： H04L7/00 , H04J3/06

摘要： 本申请公开了一种电力实时仿真中的步长同步校准方法、装置及相关设备，该方法包括：当接收到同步源发送出的同步信号时，获取此时的接收时刻；将所述接收时刻减去上一个接收时刻，得到接收间隔；基于所述接收间隔、上一周期的计数值、计数器在当前周期的计数值、所述计数器的计数周期和同步信号的通信间隔，确定当前周期的计数值，所述通信间隔为预先获取的；基于当前周期的计数值、上一周期的计数值、预设的目标步长、同步源发送同步信号的目标时间间隔、所述计数周期以及同步源到仿真核的通信时延，确定下一次仿真步长的起始计数值，其中，所述通信时延为预先获取的。本申请充分虑及了通信通道的通信抖动情况，有利于实现各仿真核的同步仿真。

9.

发明公开
一种基于RT-LAB的风电场低穿硬件在环测试方法和装置审中-实审

公开(公告)号：CN118112952A

公开(公告)日：2024-05-31

申请号：CN202410226726.0

申请日：2024-02-29

申请人： 南方电网科学研究院有限责任公司 , 云南电网有限责任公司电力科学研究院

发明人： 汤雨葭 , 奚鑫泽 , 胡云 , 邢超 , 郭琦 , 马遵 , 涂亮 , 李胜男 , 黄立滨 , 许守东 , 李书勇 , 覃日升 , 朱益华 , 李俊鹏 , 郭海平 , 戴云航 , 罗超 , 和鹏 , 曾冠铭 , 何鑫 , 卢远宏 , 邓灿 , 陈钦磊 , 孟贤 , 苏明章 , 马红升 , 郭天宇

IPC分类号： G05B17/02

摘要： 本发明提供了一种基于RT‑LAB的风电场低穿硬件在环测试方法和装置，属于风电机组低电压穿越能力测试技术领域。该方法基于RT‑LAB实时仿真平台，搭建与风电场的真实场景相同的仿真模型；根据仿真模型中仿真器和被测控制器的对应输入输出关系进行接线；根据RT‑LAB规则对仿真模型进行实时化，建立RT‑LAB工程；进行通道测试，确保仿真器和控制器之间的通道正常；按照低穿测试要求进行低电压穿越测试，获取测试结果。本发明采用硬件在环仿真的测试方法，以仿真模型替代了实际设备或环境，可开展极限测试、故障测试及在实际的环境下费用高昂或不能开展的测试等。

10.

发明公开
一种调频控制性能仿真系统及测试方法、设备和介质审中-实审

公开(公告)号：CN118091292A

公开(公告)日：2024-05-28

申请号：CN202410254510.5

申请日：2024-03-06

申请人： 南方电网科学研究院有限责任公司 , 云南电网有限责任公司电力科学研究院

发明人： 胡云 , 奚鑫泽 , 郭琦 , 邢超 , 涂亮 , 马遵 , 黄立滨 , 李胜男 , 李书勇 , 许守东 , 朱益华 , 覃日升 , 郭海平 , 李俊鹏 , 罗超 , 戴云航 , 曾冠铭 , 和鹏 , 卢远宏 , 何鑫 , 陈钦磊 , 邓灿 , 苏明章 , 孟贤 , 郭天宇 , 马红升

IPC分类号： G01R31/00 , H02J3/38 , H02J3/24 , G01R23/02

摘要： 本申请公开了一种调频控制性能仿真系统及测试方法、设备和介质，系统包括：场站工作站，用于设置场站级控制器的调频控制响应参数；场站并网点频率信号模拟发生器，用于生成新能源场站并网点多种工况点的频率信号，并发送至场站级控制器；场站拓扑模拟器，用于通过实时仿真平台搭建用于新能源场站模型；场站级控制器，用于基于一次调频控制算法参数，结合频率信号生成场站控制指令并发送至场站拓扑模拟器中的各新能源发电模型，使得各新能源发电模型响应场站控制指令进行调频；实时仿真工作站，用于采集新能源场站模型的运行数据，用于分析场站调频动态响应性能并进行记录。从而为解决新能源场站一次调频控制性能的测试方法提供了一种方案。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类