一种基于新一代申威众核处理器从核局存受限优化方法

    公开(公告)号:CN118245118B

    公开(公告)日:2024-07-26

    申请号:CN202410679259.7

    申请日:2024-05-29

    Abstract: 本发明涉及一种基于新一代申威众核处理器从核局存受限优化方法,属于电子信息的技术领域,包括:针对依赖数据占用存储小于共享LDM最大存储空间的情况,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在数组中,从核通过DMA或者共享LDM空间DMA方式从主核获取依赖数据,完成计算;针对依赖数据占用存储不小于共享LDM最大存储空间的情况,在主核中构建一个哈希表,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在哈希表中;从核通过DMA或者共享LDM空间DMA方式获取哈希表,从而获取所需的依赖数据,完成计算。本发明将预先计算好的依赖部分分配给从核执行,从而有效提高程序的效率。

    基于负载预测的能耗均衡作业调度方法及系统

    公开(公告)号:CN117707742B

    公开(公告)日:2024-05-24

    申请号:CN202410159991.1

    申请日:2024-02-05

    Abstract: 本发明涉及高性能计算的作业调度技术领域,公开了基于负载预测的能耗均衡作业调度方法及系统,方法包括:获取历史时间段内,集群中节点的负载指标数据和功耗数据;对负载指标数据进行预处理并提取每个节点的历史负载特征变量;将每个节点的历史负载特征变量,输入到训练后的负载预测模型中,输出每个节点在未来时间点的负载预测值;根据每个节点在未来时间点的负载预测值,将集群中的每个节点划分为不同的负载类别;在每个负载类别中,按照功耗值由低到高的顺序对节点进行排序,优先选取低负载类别节点中的低功耗节点进行作业调度;调度后对高负载类别节点上运行的作业,实施作业迁移。本发明能够避免负载不均衡导致的热点问题和系统性能下降。

    基于新一代申威众核处理器的从核数量调整并行加速方法

    公开(公告)号:CN117632530B

    公开(公告)日:2024-05-03

    申请号:CN202410100803.8

    申请日:2024-01-25

    Abstract: 本发明涉及基于新一代申威众核处理器的从核数量调整并行加速方法,属于电子信息技术领域。包括:定义初始临界资源控制器CRC精确度;在从核访问主存的过程中,通过临界资源控制器CRC控制的形式,以控制多次所得到从核数量对应的平均时间差值为基准,根据时间差值增大或减少的情况进行临界资源控制器CRC精确度大小的调整,在确定临界资源控制器CRC控制的精确度为1时,即比较相邻从核数量所对应的时间,以此得到最佳的时间和最合适的从核数量。本发明解决了从核执行程序段中的数量选择问题。该方法可以快捷、便利地找到最佳的从核数量,有效的降低程序执行的时间,从而提高应用程序的并行效率,可以适用于申威系列众核处理器。

    求解旅行商问题的MMAS算法并行优化方法及系统

    公开(公告)号:CN117787523A

    公开(公告)日:2024-03-29

    申请号:CN202311850022.2

    申请日:2023-12-28

    Abstract: 本发明提出了求解旅行商问题的MMAS算法并行优化方法及系统,涉及并行优化技术领域。包括根据sw26010pro众核处理器的物理结构,设计一级并行MMAS算法模型,将总种群按照进程数分成若干个子种群,每一子种群对应一个进程;划分主进程和多个从属进程,将执行主进程的核组作为主核组,将执行从属进程的核组作为从属核组,多个从属核组之间为进程级并行;主核组负责管理全局信息,同时控制执行从属任务的从属核组,从属核组分别构建旅行路线,得到局部最佳路径,与主核组之间进行信息迭代,直至满足迭代停止条件,得到全局最佳路径。本发明加速了TSP问题的求解,从而满足求解较大规模旅行商问题的实际需求。

    基于资源使用率预测的作业超量分配调度方法及系统

    公开(公告)号:CN117707747A

    公开(公告)日:2024-03-15

    申请号:CN202410166795.7

    申请日:2024-02-06

    Abstract: 本公开提供了基于资源使用率预测的作业超量分配调度方法及系统,涉及高性能计算的作业调度技术领域,若目标作业为长作业,则将长作业注册到资源使用率预测模块的工作队列中,获取实时的各节点的资源使用率数据,并输入至资源使用率预测模块预测所有运行长作业的节点未来设定时间各类资源的使用率情况,并使用调度算法根据资源使用率预测模型输出的预测数据确定最优运行节点;若目标作业为短作业,则根据其总体资源使用率的估计值在所有运行长作业的节点中进行匹配,并分配到最佳匹配节点;本公开有效解决了集群中的资源闲置问题。

    基于多粒度卷积特征融合的中文情感分析方法及系统

    公开(公告)号:CN117688944A

    公开(公告)日:2024-03-12

    申请号:CN202410128833.X

    申请日:2024-01-31

    Abstract: 本发明提出了基于多粒度卷积特征融合的中文情感分析方法及系统,涉及自然语言处理领域,具体方案包括:对待分析的中文文本数据进行分词处理,得到词向量;将所述词向量分别输入到多粒度卷积层和L‑BiLSTM层,得到局部情感特征和全局情感特征;所述局部情感特征和全局情感特征经过特征融合层和缩放点积自注意力层后,得到文本情感特征;基于文本情感特征,通过寻找情感标签转移概率优化情感标签,得到最优的情感分类结果;本发明在传统的BiLSTM网络中引入长度门,动态地调整输出序列的长度,得到L‑BiLSTM网络,综合Bert模型和多粒度卷积网络,实现对文本情感特征的高效保留和高效提取,显著提高了中文情感分析的准确性。

Patent Agency Ranking