-
公开(公告)号:CN114090954A
公开(公告)日:2022-02-25
申请号:CN202111311588.9
申请日:2021-11-08
Applicant: 湖南大学
Abstract: 本发明公开了一种基于FT‑2000+的整数矩阵乘法内核优化方法,包括如下步骤:步骤一、根据输入和输出矩阵数据长度的不同,对子函数的设计内容加以区分;步骤二、基于指定目标,同时结合飞腾2000+体系结构,确定计算内核规模及内核寄存器分配策略;步骤三、确定矩阵分块策略;步骤四、根据步骤三汇总确定的分块策略,确定矩阵数据重排策略,得到优化后的FT‑2000+的整数矩阵乘法内核。本发明基于飞腾2000+处理器对GEMM函数进行研究与优化,结果表明本专利实现的GEMM对比当前主流的径源BLAS库与数学计算库,计算速度有明显提升。