基于新一代申威众核处理器多分支自动分析并行优化方法

    公开(公告)号:CN118245117B

    公开(公告)日:2024-08-09

    申请号:CN202410676339.7

    申请日:2024-05-29

    Abstract: 本发明涉及基于新一代申威众核处理器多分支自动分析并行优化方法,属于电子信息的技术领域;包括:对源码进行预处理,仅保留源码中的主要特征信息;对保留的源码中的主要特征信息进行分析,识别并标记应用程序中的热点;通过标签法对热点进行分类,并将热点以任务的形式散播到各从核块中;根据计算量的大小,选择不同的从核块,并自动通过不同方法处理具有不同特征的热点程序段。本发明考虑面向应用程序进行并行优化时,需要进行大量工作对程序进行标记分析,耗费很多资源,所以需要一种自动化并行工具,对程序进行分析和并行优化。因此本发明减少了并行编程的难度,提高了并行编程的效率。本发明具有明显的加速效果,且能很好的满足用户的需求。

    基于申威众核处理器的含依赖及交叉循环从核优化方法

    公开(公告)号:CN118409801A

    公开(公告)日:2024-07-30

    申请号:CN202410888133.0

    申请日:2024-07-04

    Abstract: 本发明涉及基于申威众核处理器的含依赖及交叉循环从核优化方法,属于电子信息的技术领域。包括:对在每次计算周期内存在较大依赖的数据进行预处理,降低依赖数据的依赖强度,即:将最高维度的依赖数据降低到不影响计算的最低维度;将多个步骤的计算过程合并到一次从核组启动到关闭的过程中,并且将从核组再次细化为若干个从核小组,从核小组间采用单指令流多数据流的并行策略,从核小组内采用多指令流多数据流的并行策略;显式管理利用局部数据存储LDM,一次性从主存传入所需要的计算数据。本发明有效降低了一次传入从核LDM中的数据量,节约了LDM的使用空间,降低了传输的带宽压力,增加了LDM使用和数据传输效率。

    一种基于新一代申威众核处理器的进程间通信优化方法

    公开(公告)号:CN118012818B

    公开(公告)日:2024-07-19

    申请号:CN202410428041.4

    申请日:2024-04-10

    Abstract: 本发明涉及一种基于新一代申威众核处理器的进程间通信优化方法;属于电子信息的技术领域,将芯片内的核组划分不同的进程通信域;包括芯片之间的通信优化和芯片内部的通信优化;芯片之间的通信优化,包括:划分通信域;划分进程,将不同的进程分配到不同的通信域中;不同进程根据数据使用规律和机器硬件架构划分到不同的通信域;在不同的通信域中同时进行不同的进程间通信操作;芯片内部的通信优化,包括:对于不同类型的进程间通信操作,由一个特定的核组编号的进程在交叉段上申请一片空间,在同一芯片上的不同核组分别向交叉段中特定位置同时添加数据,在所有进程间执行一次同步。本发明为不同类型的进程通信操作提供了不同的方法。

    基于资源使用率预测的作业超量分配调度方法及系统

    公开(公告)号:CN117707747B

    公开(公告)日:2024-05-24

    申请号:CN202410166795.7

    申请日:2024-02-06

    Abstract: 本公开提供了基于资源使用率预测的作业超量分配调度方法及系统,涉及高性能计算的作业调度技术领域,若目标作业为长作业,则将长作业注册到资源使用率预测模块的工作队列中,获取实时的各节点的资源使用率数据,并输入至资源使用率预测模块预测所有运行长作业的节点未来设定时间各类资源的使用率情况,并使用调度算法根据资源使用率预测模型输出的预测数据确定最优运行节点;若目标作业为短作业,则根据其总体资源使用率的估计值在所有运行长作业的节点中进行匹配,并分配到最佳匹配节点;本公开有效解决了集群中的资源闲置问题。

    基于申威众核处理器的主从核监测交互的计算量调度方法

    公开(公告)号:CN117632520B

    公开(公告)日:2024-05-17

    申请号:CN202410100805.7

    申请日:2024-01-25

    Abstract: 本发明涉及基于申威众核处理器的主从核监测交互的计算量调度方法,属于电子信息技术领域。包括:在计算量传输过程中,通过从核状态监测器SW‑CSM实现主核对从核状态的判断与监测;通过主从核协作交互器MCCI实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。

    一种基于DKT与汤普森采样算法的习题推荐方法及系统

    公开(公告)号:CN117743699A

    公开(公告)日:2024-03-22

    申请号:CN202410188406.0

    申请日:2024-02-20

    Abstract: 本发明涉及一种基于DKT与汤普森采样算法的习题推荐方法及系统,属于新一代信息技术和在线教育技术领域;本发明将汤普森采样算法与基于用户的协同过滤算法相结合,特别为新用户设计了一种基于用户的协同过滤算法,解决深度知识追踪模型面临的冷启动问题。而且考虑了用户的个人背景和需求进行相关习题的推荐。本发明采用了基于多头注意力机制的知识追踪模型,加入习题类型特征,通过对用户的答题数据和答题结果进行深入分析,准确预测用户对未尝试习题的答题表现以及知识掌握情况。使推荐系统能够动态地调整习题难度和类型,以匹配用户的实际学习进度和能力。

    一种申威众核处理器从核簇加速并行方法、设备及介质

    公开(公告)号:CN117472448A

    公开(公告)日:2024-01-30

    申请号:CN202311829650.2

    申请日:2023-12-28

    Abstract: 本发明涉及一种申威众核处理器从核簇加速并行方法、设备及介质,属于电子信息技术领域;包括:应用程序优化阶段:对应用程序进行优化;输入导入阶段:将各从核所需的输入条件从主存储器传入LDM连续共享空间;计算与RMA传输阶段:计算从核即刻开始执行计算任务;从核将计算结果传输到主存储器时,由汇总从核将计算结果读取到本地LDM;汇总与整理阶段:汇总从核读取完计算从核此时的计算结果后进行整理;DMA传输阶段:将计算结果传输至主存储器中;重复执行上述阶段直到当前迭代次数达到预先设定的迭代总次数。本发明提供了适合处理以上情况的多种优化方法,拥有明显的加速效果,减少了使用难度,提高了用户体验。

Patent Agency Ranking