加速卡算子适配方法、装置、计算机设备、存储介质

    公开(公告)号:CN119539036A

    公开(公告)日:2025-02-28

    申请号:CN202411445088.8

    申请日:2024-10-16

    Applicant: 湖南大学

    Abstract: 本申请涉及一种加速卡算子适配方法、装置,通过将算子源代码放入预定文件夹;将所述算子源代码转化为抽象语法树AST;根据所述抽象语法树AST,利用MLIR工具生成Looplet dialect;根据加速卡的架构,在所述Looplet dialect内对加速卡算子进行优化;通过MLIR工具将所述Looplet dialect转换为affine dialect;基于所述affine dialect,采用多面体模型对所述加速卡算子进行优化;通过MLIR工具将所述affine dialect转化为llvm dialect;通过LLVM工具将llvm dialect转化为llvm IR;利用LLVM下LLC工具将llvm IR编译为可执行二进制文件。解决了现有技术不同架构的国产加速卡需要构建不同的算子,成本高,效率低的技术问题,达到了同一套算子源码优化后部署到不同架构的国产加速卡上,适配性高,成本低,效率高的技术效果。

Patent Agency Ranking