一种基于FT-2000+的整数矩阵乘法内核优化方法

    公开(公告)号:CN114090954A

    公开(公告)日:2022-02-25

    申请号:CN202111311588.9

    申请日:2021-11-08

    Applicant: 湖南大学

    Inventor: 全哲 肖仕扬

    Abstract: 本发明公开了一种基于FT‑2000+的整数矩阵乘法内核优化方法,包括如下步骤:步骤一、根据输入和输出矩阵数据长度的不同,对子函数的设计内容加以区分;步骤二、基于指定目标,同时结合飞腾2000+体系结构,确定计算内核规模及内核寄存器分配策略;步骤三、确定矩阵分块策略;步骤四、根据步骤三汇总确定的分块策略,确定矩阵数据重排策略,得到优化后的FT‑2000+的整数矩阵乘法内核。本发明基于飞腾2000+处理器对GEMM函数进行研究与优化,结果表明本专利实现的GEMM对比当前主流的径源BLAS库与数学计算库,计算速度有明显提升。

Patent Agency Ranking