-
公开(公告)号:CN118966322A
公开(公告)日:2024-11-15
申请号:CN202410986611.1
申请日:2024-07-23
申请人: 麒麟软件有限公司
摘要: 本发明涉及计算机技术领域,具体提供一种面向沐曦曦云C500的归约类核函数优化方法,包括:获取待执行规约主体的数据长度N,并选择数据长度N大于预设值的规约主体执行以下步骤;将核函数中线程数设为1024;计算每个线程需要处理的数据个数NUM;根据NUM确定每个线程的处理次数W、向量长度X、并行处理向量个数Z及最后一次并行处理向量个数Z’;然后设置核函数启动参数,对每个线程中的向量内、向量间、每个线程的处理次数、所有线程的数据依次进行规约操作。通过上述技术方案,对于输入的数据量较大的规约主体,在一个block中的1024个线程内根据规约主体的数据长度,实现配置参数的优化,提高核函数开发效率。