电力矩阵LU分解加速方法、装置、设备及存储介质

    公开(公告)号:CN116862750A

    公开(公告)日:2023-10-10

    申请号:CN202310827171.0

    申请日:2023-07-06

    IPC分类号: G06T1/20 G06T1/60 G06F17/16

    摘要: 本发明涉及电力系统高性能计算技术领域,公开了电力矩阵LU分解加速方法、装置、设备及存储介质,方法包括:根据电力矩阵中列与列之间的依赖关系,对电力矩阵进行分层处理,得到多个层级;层级中包含一个或多个列;根据每个层级的列数量,从多个处理单元中确定对应层级中每一列的目标处理单元,以及每一列的目标处理单元的预设数量;列数量表示对应层级中列的数量,多个处理单元包括CUDA线程、CUDA线程束或者CUDA流;分别对对应层级中的每一列采取预设数量的目标处理单元,预设数量的目标处理单元用于对对应层级中的每一列执行LU分解。本发明能够根据电力矩阵特性,对GPU资源进行灵活调整,从而达到提高电力矩阵LU分解在GPU上的计算速度的目的。

    一种FPGA内核可编程仿真器

    公开(公告)号:CN113673106B

    公开(公告)日:2024-02-13

    申请号:CN202110962803.5

    申请日:2021-08-20

    IPC分类号: G06F30/20 G06F15/78

    摘要: 本发明公开了一种FPGA内核可编程仿真器,包括:运行时连接于驱动器与主机之间,驱动器内置至少一个被测FPGA内核,驱动器对全部的FPGA内核进行包装;当FPGA内核可编程仿真器启动时,主机向运行时发送第一控制信号,通过调用运行时中的仿真器对被测FPGA内核及驱动器进行仿真;当FPGA内核可编程仿真器运行时,运行时将主机发送的第二控制信号至驱动器,并根据第二控制信号,向驱动器发送命令,被测FPGA内核根据接收的命令进行计算,并通过运行时向主机返回相应的计算结果,将高抽象级别的被测FPGA内核与现有高质量仿真器进行集成,使开发者能够使用高抽象级别的开发软件进行FPGA内核开发并使用现有高质量仿真器仿真,方便FPGA内核开发者并提高FPGA内核的仿真效率。

    一种深度学习技术工具链系统

    公开(公告)号:CN112926736B

    公开(公告)日:2023-12-08

    申请号:CN202110221144.X

    申请日:2021-02-26

    摘要: 型迁移时间和成本。本发明公开了一种深度学习技术工具链系统,包括:深度学习技术工具链系统架构、深度学习技术工具链的接口定义与组件实现、灵活查询模块,深度学习技术工具链系统架构为以模型仓库为核心的架构,通过深度学习训练的流程将整个系统分为几个相互独立而又互相依赖的功能模块,通过定义深度学习技术工具链每个功能模块的接口,将接口与实现分离,在接口的基础上实现深度学习工具链的各模块,通过灵活查询模块自定义各种查询条件,在每个流程模块生成供下一流程模块使用所需的数据,实现了从原始数据到标注数据再到样本数据到模型再到应用的(56)对比文件邢源“.面向大数据的机器学习算法支撑平台设计与实现”《.硕士电子期刊》.2019,(第第08期期),第1-8章.

    一种单水电站水力机组优化调度方法、装置、设备及介质

    公开(公告)号:CN116862073A

    公开(公告)日:2023-10-10

    申请号:CN202310890546.8

    申请日:2023-07-19

    摘要: 本发明涉及水电调度技术领域,公开了一种单水电站水力机组优化调度方法、装置、设备及介质,该方法包括:根据优化目标以及约束条件确定单水电站机组组合问题对应的问题定义;基于拉格朗日对偶分解法确定优化目标求得最优解对应的最优性条件;基于最优性条件对问题定义进行简化,得到简化的等价问题定义;根据简化的等价问题定义对单水电站机组组合问题进行求解,得到单水电站水力机组优化调度方案。由于采用拉格朗日对偶分解法确定了优化目标求得最优解对应的最优性条件,基于最优性条件对问题定义进行简化再求解确定优化调度方法,达到了减少计算时间的效果,解决了相关技术中存在的确定单水电站水力机组优化调度方案所需的计算时间较长的问题。

    电力系统三角稀疏方程组求解加速器及方法

    公开(公告)号:CN116304489A

    公开(公告)日:2023-06-23

    申请号:CN202310181098.4

    申请日:2023-02-16

    IPC分类号: G06F17/11 G06F18/23

    摘要: 本发明公开了一种电力系统三角稀疏方程组求解加速器及方法,其中,求解加速器包括通用处理器和加速处理器,通用处理器用于按照求解过程中的依赖关系,确定三角稀疏矩阵中各行节点的层级,其中,高层级的行节点依赖于低层级的行节点,且同一层级的行节点之间相互独立;加速处理器,包括多个与求解相关的求解处理单元,加速处理器用于基于低层级行节点的非零元素,对三角方程组进行第一求解,以及基于高层级行节点的非零元素和第一求解的结果,对三角方程组进行第二求解,其中,在同一个层级包括多个行节点的情况下,加速处理器通过多个求解处理单元并行处理同一层级下不同行节点的数据,以对三角方程组进行并行求解,从而提高求解效率。