-
公开(公告)号:CN119539036A
公开(公告)日:2025-02-28
申请号:CN202411445088.8
申请日:2024-10-16
Applicant: 湖南大学
Abstract: 本申请涉及一种加速卡算子适配方法、装置,通过将算子源代码放入预定文件夹;将所述算子源代码转化为抽象语法树AST;根据所述抽象语法树AST,利用MLIR工具生成Looplet dialect;根据加速卡的架构,在所述Looplet dialect内对加速卡算子进行优化;通过MLIR工具将所述Looplet dialect转换为affine dialect;基于所述affine dialect,采用多面体模型对所述加速卡算子进行优化;通过MLIR工具将所述affine dialect转化为llvm dialect;通过LLVM工具将llvm dialect转化为llvm IR;利用LLVM下LLC工具将llvm IR编译为可执行二进制文件。解决了现有技术不同架构的国产加速卡需要构建不同的算子,成本高,效率低的技术问题,达到了同一套算子源码优化后部署到不同架构的国产加速卡上,适配性高,成本低,效率高的技术效果。