一种自适应任务调度方法

    公开(公告)号:CN114327808B

    公开(公告)日:2025-01-28

    申请号:CN202110425774.9

    申请日:2021-04-20

    Abstract: 本发明公开一种自适应任务调度方法,包括在课题开始运行后运行时系统对计算资源进行初始化,初始化节点类型,划分区域,选取节点类型,初始化任务池;课题正式运行时进行任务分配与调度,随着叶子计算节点完成任务后动态生成新任务并进行调度,当叶子计算节点完成某一任务计算且动态产生新的任务时,叶子节点选择第一个新任务继续进行计算,并通过消息回报其余新产生任务(如果存在)给区域主节点,全局主节点采用消息对各区域任务池进行探测,当某一区域任务显著高于其余区域时,对该区域任务进行回收,进入动态子任务任务池。本发明可避免课题运算过程中动态生成的任务导致负载不均衡的现象,提升计算资源的利用率和课题解算效率。

    基于cache写暗示机制的编译优化方法

    公开(公告)号:CN114217806B

    公开(公告)日:2025-01-10

    申请号:CN202110347315.3

    申请日:2021-03-31

    Abstract: 本发明公开一种基于cache写暗示机制的编译优化方法,自动识别对连续主存进行写操作的指令序列,并通过指令插桩,对这些指令序列的访存行为进行优化,包括以下步骤:S1:对代码中所有写操作进行识别,并通过插桩的方式进行标记;S2:对S1中识别的写操作的数据单元访问连续性进行判定,如果满足连续性要求,则更新cachesc指令参数;S3:写操作边界处理。本发明可减少因繁琐的存储管理对代码生产过程的干扰,进一步降低访存延迟,提高存储系统性能。

    基于迭代逼近的RDMA缓冲区动态分配方法

    公开(公告)号:CN112433980B

    公开(公告)日:2022-07-12

    申请号:CN201910788875.5

    申请日:2019-08-26

    Abstract: 本发明公开一种基于迭代逼近的RDMA缓冲区动态分配方法,包括以下步骤:S1、初始化时,RDMA发起方做以下设置:将请求分配的缓冲区数量记为rbuf_thresh,初始值设为4,rbuf_thresh扩张时的时间记为epoch_start,初始值设为当前时间,rbuf_thresh扩张前的rbuf_thresh记为Rmin,初始值设为2,rbuf_thresh扩张后的rbuf_thresh记为Rmax,初始值设为4,rbuf_thresh扩张后Rmax减少到Rmin的时间记为K,初始化为K=,其中C是一个常数系数;S2、RDMA发起方检查本地保存的RDMA缓冲区列表,判断RDMA被动方是否有可用的RDMA缓冲区;S3、RDMA被动方收到RDMA主动方发来的分配RDMA缓冲区请求后,根据该请求中的rbuf_thresh分配新的RDMA缓冲区,并通告给RDMA主动方。本发明实现了对RDMA缓冲区的动态分配,在保证网络高带宽的同时,可以显著降低预先分配的RDMA缓冲区数量,降低内存消耗量。

    一种计算核心加速的通信优化方法

    公开(公告)号:CN114218147A

    公开(公告)日:2022-03-22

    申请号:CN202110480202.0

    申请日:2021-04-30

    Abstract: 本发明公开一种计算核心加速的通信优化方法,包括以下步骤:S1、控制核心通过检查运算核心的状态参数,感知运算核心是否处于空闲状态;S2、若运算核心处于空闲状态,则利用运算核心的聚合访存能力加速通信中的数据传输或者利用运算核心的计算能力加速通信中的数据计算,实现通信优化;若运算核心不空闲,则利用控制核心正常通信;S3、通信完毕,优化结束。本发明将通信协议的部分步骤卸载至运算核心阵列,利用运算核心来提升通信性能,实现通信支撑服务与异构体系结构的深度融合,以达到加速通信过程的目的。

    基于迭代逼近的RDMA缓冲区动态分配方法

    公开(公告)号:CN112433980A

    公开(公告)日:2021-03-02

    申请号:CN201910788875.5

    申请日:2019-08-26

    Abstract: 本发明公开一种基于迭代逼近的RDMA缓冲区动态分配方法,包括以下步骤:S1、初始化时,RDMA发起方做以下设置:将请求分配的缓冲区数量记为rbuf_thresh,初始值设为4,rbuf_thresh扩张时的时间记为epoch_start,初始值设为当前时间,rbuf_thresh扩张前的rbuf_thresh记为Rmin,初始值设为2,rbuf_thresh扩张后的rbuf_thresh记为Rmax,初始值设为4,rbuf_thresh扩张后Rmax减少到Rmin的时间记为K,初始化为K= ,其中C是一个常数系数;S2、RDMA发起方检查本地保存的RDMA缓冲区列表,判断RDMA被动方是否有可用的RDMA缓冲区;S3、RDMA被动方收到RDMA主动方发来的分配RDMA缓冲区请求后,根据该请求中的rbuf_thresh分配新的RDMA缓冲区,并通告给RDMA主动方。本发明实现了对RDMA缓冲区的动态分配,在保证网络高带宽的同时,可以显著降低预先分配的RDMA缓冲区数量,降低内存消耗量。

    一种基于哈希算法的库函数安全增强方法

    公开(公告)号:CN105426755B

    公开(公告)日:2018-04-10

    申请号:CN201510830262.5

    申请日:2015-11-24

    Abstract: 本发明提供了一种基于哈希算法的库函数安全增强方法,包括:对同一函数的多次调用,将已经回溯的栈信息用链表保存起来,此后再次调用该函数时,以函数返回地址作为关键字检索链表以查找所述函数的栈信息,如果在链表中查找到所述函数的栈信息,则直接从链表取出对应的栈信息。如果在链表中没有查找到所述函数的栈信息,则针对所述函数利用指令特征码进行指令匹配,直到找到所述函数的栈信息为止,并将找到的所述函数的栈信息加入到链表中。

    一种无横向一致性的众核精简Cache协议实现方法

    公开(公告)号:CN114217809B

    公开(公告)日:2024-04-30

    申请号:CN202110398338.7

    申请日:2021-04-14

    Abstract: 本发明公开一种无横向一致性的众核精简Cache协议实现方法,包括以下步骤:S1、对Cache行内数据更新情况进行分析,标记出被更新的数据;S2、如果Cache行内所有数据都没有被更新,或者Cache行内所有数据都被更新,跳转至S5,如果Cache行内只有部分数据被更新,跳转至S3;S3、当一个Cache行内的数据只有部分内容需要写回时,其他位掩码置0;S4、根据掩码粒度大小与置位情况,更新主存中对应掩码位为1的数据;S5、直接对Cache行进行写回操作。本发明有效解决共享主存Cache结构的假共享问题,还可以提高写回效率、有效降低处理器在Cache数据管理方面的硬件开销。

    动态链接模式片上存储器空间分配方法

    公开(公告)号:CN114564150B

    公开(公告)日:2024-03-22

    申请号:CN202210185703.0

    申请日:2022-02-28

    Abstract: 本发明公开一种动态链接模式片上存储器空间分配方法,包括以下步骤:在程序源文件中为需要优化的数据添加动态链接模式局部存储器数据关键字__ldm;编译器判断该局部存储器变量是否位于动态库中;对于动态库中的局部存储器变量,在链接脚本中为其设置单独的PT_LOAD段;对于动态库中的局部存储器变量,在动态链接器中修正局部存储器数据地址。本发明能够有效避免动态库中LDM变量地址相互冲突的问题,显著提升了异构众核AI处理器的好用性。

    面向众核多层次存储系统的数据高效传输支持方法

    公开(公告)号:CN112738142B

    公开(公告)日:2022-11-25

    申请号:CN201910974455.6

    申请日:2019-10-14

    Abstract: 本发明公开了一种面向众核多层次存储系统的数据高效传输支持方法,包括典型访存通信模式性能库和运行时最优模式选择模块,所述典型访存通信模式性能库是通过以下步骤构建形成的,总结科学计算程序中的典型通信访存模式;对每种典型通信访存模式,用多种通信访存方案具体实现;对每种实现通信访存方案,测试在不同数据规模下的性能以及需要的缓冲空间的大小,构建典型访存通信模式性库;所述运行时最优模式选择模块则根据用户程序的访存通信模式、访存数据量、可用缓冲空间大小信息,搜索典型访存通信模式性库,选择最优实现方案。本发明减轻编程人员负担的同时,提供高效的实现方案,对于不了解存储系统细节的编程人员,也能很好的利用系统特性。

    支持有限域数据类型和运算符的编译方法

    公开(公告)号:CN112579059B

    公开(公告)日:2022-10-04

    申请号:CN201910927244.7

    申请日:2019-09-27

    Abstract: 本发明公开一种支持有限域数据类型和运算符的编译方法,在GCC编译器中新增对__field关键字的支持,用于对有限域上数据类型的描述,所述__field是有限域上的数据类型,此__field类型中包含固定的两个常量成员,此两个常量成员的名字是固定的,用户通过指定此两个常量成员的值,定义一个具体的有限域类型,再使用定义的有限域类型,声明有限域上的变量;在GCC编译器中新增有限域数据类型关键字__field,扩展GCC编译器前端,增加对有限域数据类型关键字__field的支持,扩展GCC编译器前端,增加对有限域数据类型关键字表达式的语法分析和语义分析操作,使得编译器为有限域数据类型关键字相关的初始化表达式、赋值表达式、运算表达式、打印语句进行正确的分析。本发明提高用户程序中有限域运算的效率。

Patent Agency Ranking