-
公开(公告)号:CN113722269B
公开(公告)日:2023-01-24
申请号:CN202110990045.8
申请日:2021-08-26
Applicant: 北京大学
IPC: G06F15/80
Abstract: 本申请公开了一种基于昇腾AI处理器的跨步切片算子处理方法及装置。其中,该方法包括:获取跨步切片算子的输入张量和待提取切片的下标;基于所述待提取切片的下标确定所述待提取切片在所述输入张量中的起始下标和长度;利用所述起始下标和所述长度从所述输入张量中确定待搬运的数据;通过昇腾AI处理器的输出缓冲区将所述待搬运的数据搬运至输出张量。本申请解决了跨步切片算子处理速度低的技术问题。
-
公开(公告)号:CN113722269A
公开(公告)日:2021-11-30
申请号:CN202110990045.8
申请日:2021-08-26
Applicant: 北京大学
Abstract: 本申请公开了一种基于昇腾AI处理器的跨步切片算子处理方法及装置。其中,该方法包括:获取跨步切片算子的输入张量和待提取切片的下标;基于所述待提取切片的下标确定所述待提取切片在所述输入张量中的起始下标和长度;利用所述起始下标和所述长度从所述输入张量中确定待搬运的数据;通过昇腾AI处理器的输出缓冲区将所述待搬运的数据搬运至输出张量。本申请解决了跨步切片算子处理速度低的技术问题。
-
公开(公告)号:CN108334409A
公开(公告)日:2018-07-27
申请号:CN201810033927.3
申请日:2018-01-15
Applicant: 北京大学
CPC classification number: G06F9/5027 , G06F9/5016 , G06F9/5022 , G06F2209/504 , H04L43/0817 , H04L63/08 , H04L63/168 , H04L67/10
Abstract: 本发明公布了一种细粒度的高性能云资源管理调度方法,通过限制用户登录计算节点、按核心与内存同比例资源调度、限制每个GPU使用CPU核数、作业结束释放占用资源以及SSH登陆使用资源管理、登录节点资源限制等方式,可用来改进SLURM作业调度系统中任务按照CPU核心进行分配时的内存和GPU资源的管理,并实现对用户SSH登录的资源进行Cgroup限制,从而完善基于SLURM的资源调度系统,使得高性能云平台资源调度更加高效与合理。
-
公开(公告)号:CN117972670A
公开(公告)日:2024-05-03
申请号:CN202410365223.1
申请日:2024-03-28
Applicant: 北京大学
Abstract: 本申请公开了一种云端容器镜像的搭建方法及装置。其中,该方法包括:响应于第一对象的登录请求对第一对象进行身份认证;在身份认证通过时,检测第一对象是否具有singularity伪根用户权限,在第一对象不具有singularity伪根用户权限时,为第一对象分配singularity伪根用户权限,具有singularity伪根用户权限的对象可以在不具有根用户权限的情况下搭建singularity容器镜像;响应于第一对象的容器搭建请求,搭建与容器搭建请求对应的singularity容器镜像。本申请解决了高性能计算平台应用场景中,用户因缺乏root权限难以搭建singularity容器镜像的技术问题。
-
公开(公告)号:CN114329325A
公开(公告)日:2022-04-12
申请号:CN202111374829.4
申请日:2021-11-19
Abstract: 本发明公开了一种基于昇腾AI处理器的批量矩阵乘算子的优化方法,所述方法包括:获取第一输入数据与第二输入数据,并将所述第一输入数据与所述第二输入数据搬运到AI Core;获取所述第二输入数据的加载行数,并根据所述加载行数以及预设的缓冲区的双缓存机制对所述第一输入数据和第二输入数据进行划分;将划分后的所述第一输入数据和第二输入数据加载到所述缓冲区中进行计算,得到输出数据;将所述输出数据搬运到外部存储中进行输出。本申请能够利用双缓冲机制,能够缩短第一矩阵和第二矩阵相乘的运算时间,从而提高数据处理的效率。
-
公开(公告)号:CN114329325B
公开(公告)日:2024-09-24
申请号:CN202111374829.4
申请日:2021-11-19
Abstract: 本发明公开了一种基于昇腾AI处理器的批量矩阵乘算子的优化方法,所述方法包括:获取第一输入数据与第二输入数据,并将所述第一输入数据与所述第二输入数据搬运到AI Core;获取所述第二输入数据的加载行数,并根据所述加载行数以及预设的缓冲区的双缓存机制对所述第一输入数据和第二输入数据进行划分;将划分后的所述第一输入数据和第二输入数据加载到所述缓冲区中进行计算,得到输出数据;将所述输出数据搬运到外部存储中进行输出。本申请能够利用双缓冲机制,能够缩短第一矩阵和第二矩阵相乘的运算时间,从而提高数据处理的效率。
-
公开(公告)号:CN117579402A
公开(公告)日:2024-02-20
申请号:CN202410066426.0
申请日:2024-01-17
Applicant: 北京大学
IPC: H04L9/40
Abstract: 本申请公开了一种平台二次认证登录系统及方法。其中,该系统包括:目标平台和OTP管理服务器,目标平台对目标对象输入的账户名和密码进行一次认证,在认证通过时将账户名发送至OTP管理服务器,OTP管理服务器查询该账户名是否已注册;若其已注册则向目标平台发送输入OTP码的提示信息;若其未注册则向目标平台发送注册提示信息,在账户名完成注册后向目标平台发送输入OTP码的提示信息;目标平台将目标对象输入的OTP码发送至OTP管理服务器进行二次认证,在二次认证通过时执行与访问请求对应的访问操作。本申请解决了相关技术中OTP密钥本地化存储导致的高性能计算集群容易受到安全威胁的技术问题。
-
公开(公告)号:CN114327630B
公开(公告)日:2023-02-10
申请号:CN202210009738.9
申请日:2022-01-05
Applicant: 北京大学
Abstract: 本发明公开了一种适用于华为昇腾芯片的高性能算子生成方法。其中,该方法包括:在目标开发方式下,生成多个候选操作函数,其中,目标开发方式是基于昇腾人工智能处理器的张量加速引擎算子开发框架确定的张量迭代器内核开发方式;从多个候选操作函数选取待使用的目标操作函数;利用目标操作函数和目标操作数据执行目标操作,得到目标操作结果。本发明解决了相关技术中对于高性能算子的开发效率低下的技术问题。
-
公开(公告)号:CN113704689B
公开(公告)日:2022-11-11
申请号:CN202110984626.0
申请日:2021-08-25
Applicant: 北京大学
Abstract: 本发明公开了一种基于昇腾AI处理器的矩阵乘算子的处理方法及装置。其中,该方法包括:获取矩阵乘算子的第一源操作数和第二源操作数;对第一源操作数进行数据转换处理,得到第一转换结果,以及对第二源操作数进行数据转换处理,得到第二转换结果;对第一转换结果进行分块处理,得到第一分块结果,以及对第二转换结果进行分块处理,得到第二分块结果;采用与人工智能处理器中计算核心数量对应的多个计算核心对第一分块结果与第二分块结果进行矩阵乘运算,得到中间运算结果;对中间运算结果进行数据转换处理,得到矩阵乘算子的输出结果,其中,输出结果的输出格式为二维格式。本发明解决了矩阵乘运算的运算效率低的技术问题。
-
公开(公告)号:CN114327630A
公开(公告)日:2022-04-12
申请号:CN202210009738.9
申请日:2022-01-05
Applicant: 北京大学
Abstract: 本发明公开了一种适用于华为昇腾芯片的高性能算子生成方法。其中,该方法包括:在目标开发方式下,生成多个候选操作函数,其中,目标开发方式是基于昇腾人工智能处理器的张量加速引擎算子开发框架确定的张量迭代器内核开发方式;从多个候选操作函数选取待使用的目标操作函数;利用目标操作函数和目标操作数据执行目标操作,得到目标操作结果。本发明解决了相关技术中对于高性能算子的开发效率低下的技术问题。
-
-
-
-
-
-
-
-
-