基于跨异构编程模型的模板优化方法及装置

    公开(公告)号:CN119759359A

    公开(公告)日:2025-04-04

    申请号:CN202411832315.2

    申请日:2024-12-12

    Abstract: 本发明提供了一种基于跨异构编程模型的模板优化方法,包括:获取调优需求参数;根据预定的调优策略和所述调优需求信息,有方向性地生成调优参数种群;根据预定的遗传算法对所述调优参数种群进行搜索,多次迭代搜索直至达到收敛条件,生成对应的优化参数设置;根据预定的模板算子和所述优化参数设置,自动生成优化代码。本发明还提供一种基于跨异构编程模型的模板优化装置、存储介质及电子设备。借此,本发明能够实现基于跨异构编程模型的模板计算自动调优,不仅对于不同硬件平台均能取得较好的模板计算优化效果,而且对不同模式的模板也能找到最适用的优化技术组合。

    面向多核并行体系结构的卷积算子编译优化方法及装置

    公开(公告)号:CN119759357A

    公开(公告)日:2025-04-04

    申请号:CN202411825773.3

    申请日:2024-12-12

    Abstract: 本发明提出一种面向多核并行体系结构的卷积算子编译优化方法和装置。包括:输入转换器模块提取和去重模型中的或者用户输入的卷积参数,并生成卷积描述符组;控制器模块根据历史记录决定是否对输入模块启动调优,将需要调优的卷积描述符传递给调优器模块;调优器模块负责根据配置好的参数空间进行算子的自动调优,输出最佳参数配置;代码生成模块根据接收到的调优参数组合及卷积描述符生成HIP代码,并分别对各个参数生成的核函数进行对应编号。核函数执行模块编译和执行已生成的代码,并通过测试框架对各个核函数的性能进行测试,按编号返回对应的适应度信息并汇总为列表返回给调优器模块。

    面向深度学习推理任务编译器的算子融合方法和系统

    公开(公告)号:CN116861359A

    公开(公告)日:2023-10-10

    申请号:CN202310643920.4

    申请日:2023-06-01

    Abstract: 本发明提出一种面向深度学习推理任务编译器的算子融合方法,包括:将深度学习推理任务模型的标准模型,转化为初始图级IR;遍历该初始图级IR,将该初始图级IR中的可融合算子标识为同类算子或异类算子;将该初始图级IR转化为张量表达式,融合该张量表达式中的同类算子;将该张量表达式编译为内核源码,融合该内核源码中的异类算子;将该内核源码编译为可执行代码并部署运行。本发明还提出一种面向深度学习推理任务编译器的算子融合系统,以及一种用于深度学习推理任务编译器算子融合的数据处理装置。

Patent Agency Ranking