一种面向沐曦曦云C500的归约类核函数优化方法

    公开(公告)号:CN118966322A

    公开(公告)日:2024-11-15

    申请号:CN202410986611.1

    申请日:2024-07-23

    IPC分类号: G06N3/10 G06N3/063 G06F8/30

    摘要: 本发明涉及计算机技术领域,具体提供一种面向沐曦曦云C500的归约类核函数优化方法,包括:获取待执行规约主体的数据长度N,并选择数据长度N大于预设值的规约主体执行以下步骤;将核函数中线程数设为1024;计算每个线程需要处理的数据个数NUM;根据NUM确定每个线程的处理次数W、向量长度X、并行处理向量个数Z及最后一次并行处理向量个数Z’;然后设置核函数启动参数,对每个线程中的向量内、向量间、每个线程的处理次数、所有线程的数据依次进行规约操作。通过上述技术方案,对于输入的数据量较大的规约主体,在一个block中的1024个线程内根据规约主体的数据长度,实现配置参数的优化,提高核函数开发效率。