-
公开(公告)号:CN114281874A
公开(公告)日:2022-04-05
申请号:CN202111373725.1
申请日:2021-11-19
Abstract: 本发明涉及数据索引领域,具体是涉及一种基于昇腾AI处理器的索引转换方法及装置。本发明根据张量的数据排布格式,对算子的索引信息进行转换,使得转换之后的索引信息与张量的数据排布格式所匹配,由于对索引信息进行转换只涉及到对数字的简单运算,从而在不改变张量数据排布格式的前提下,依然能够通过转换之后的索引信息在张量中索引到相应的数据。由于本发明不涉及到改变张量数据排布格式,从而避免了因改变张量数据排布格式而耗费的时间,进而提高了算子的计算速度。
-
公开(公告)号:CN113704689A
公开(公告)日:2021-11-26
申请号:CN202110984626.0
申请日:2021-08-25
Applicant: 北京大学
Abstract: 本发明公开了一种基于昇腾AI处理器的矩阵乘算子的处理方法及装置。其中,该方法包括:获取矩阵乘算子的第一源操作数和第二源操作数;对第一源操作数进行数据转换处理,得到第一转换结果,以及对第二源操作数进行数据转换处理,得到第二转换结果;对第一转换结果进行分块处理,得到第一分块结果,以及对第二转换结果进行分块处理,得到第二分块结果;采用与人工智能处理器中计算核心数量对应的多个计算核心对第一分块结果与第二分块结果进行矩阵乘运算,得到中间运算结果;对中间运算结果进行数据转换处理,得到矩阵乘算子的输出结果,其中,输出结果的输出格式为二维格式。本发明解决了矩阵乘运算的运算效率低的技术问题。
-
公开(公告)号:CN117579402B
公开(公告)日:2024-08-20
申请号:CN202410066426.0
申请日:2024-01-17
Applicant: 北京大学
IPC: H04L9/40
Abstract: 本申请公开了一种平台二次认证登录系统及方法。其中,该系统包括:目标平台和OTP管理服务器,目标平台对目标对象输入的账户名和密码进行一次认证,在认证通过时将账户名发送至OTP管理服务器,OTP管理服务器查询该账户名是否已注册;若其已注册则向目标平台发送输入OTP码的提示信息;若其未注册则向目标平台发送注册提示信息,在账户名完成注册后向目标平台发送输入OTP码的提示信息;目标平台将目标对象输入的OTP码发送至OTP管理服务器进行二次认证,在二次认证通过时执行与访问请求对应的访问操作。本申请解决了相关技术中OTP密钥本地化存储导致的高性能计算集群容易受到安全威胁的技术问题。
-
公开(公告)号:CN118297184A
公开(公告)日:2024-07-05
申请号:CN202410417043.3
申请日:2024-04-08
Applicant: 北京大学
Abstract: 本申请公开了一种人工智能系统的质量检测方法及装置。其中,该方法包括:获取待检测的人工智能系统,并提取人工智能系统中的人工智能算子;分别确定人工智能算子与预设的标准算子库中的各个标准算子在目标维度的第一相似度,并确定最大的第一相似度对应的标准算子为与人工智能算子对应的目标标准算子,其中,标准算子库中存储有多个标准算子,每个标准算子以树结构形式存储,目标维度包括:树节点维度和树深维度;依据人工智能算子与目标标准算子之间的第一相似度确定人工智能系统的质量检测结果,该质量检测结果用于反映人工智能系统是否合格。本申请解决了相关技术中软硬件厂商在进行人工智能系统对接时难以准确检测系统质量的技术问题。
-
公开(公告)号:CN116501642A
公开(公告)日:2023-07-28
申请号:CN202310520371.1
申请日:2023-05-09
Applicant: 北京大学
IPC: G06F11/36
Abstract: 本申请公开了一种算子的测试方法及装置、非易失性存储介质、电子设备。其中,该方法包括:确定用于接收多个待测试算子库的宏函数接口,其中,多个待测试算子库基于不同的算子库框架;通过宏函数接口对多个待测试算子库中每个待测试算子的算子信息和每个待测试算子对应的测试操作进行提取;将提取到的算子信息与标准算子库中的标准算子信息进行对比,确定待测试算子中的目标待测试算子;分别基于提取到的测试操作和标准算子库中的标准测试操作对目标待测试算子进行测试,生成测试结果。本申请解决了由于无法基于不同框架的算子库中的不同算子进行测试造成的算子测试效率低下的技术问题。
-
公开(公告)号:CN108334409B
公开(公告)日:2020-10-09
申请号:CN201810033927.3
申请日:2018-01-15
Applicant: 北京大学
Abstract: 本发明公布了一种细粒度的高性能云资源管理调度方法,通过限制用户登录计算节点、按核心与内存同比例资源调度、限制每个GPU使用CPU核数、作业结束释放占用资源以及SSH登陆使用资源管理、登录节点资源限制等方式,可用来改进SLURM作业调度系统中任务按照CPU核心进行分配时的内存和GPU资源的管理,并实现对用户SSH登录的资源进行Cgroup限制,从而完善基于SLURM的资源调度系统,使得高性能云平台资源调度更加高效与合理。
-
公开(公告)号:CN108377200A
公开(公告)日:2018-08-07
申请号:CN201810052559.7
申请日:2018-01-19
Applicant: 北京大学
IPC: H04L12/24 , H04L12/863 , H04L29/08
Abstract: 本发明公布了一种基于LDAP与SLURM的云用户管理方法及系统,基于轻量级目录访问协议LDAP与Linux平台简单资源管理工具SLURM,使用服务质量QOS定制多种用户作业排队队列,实现高性能云用户管理;包括:用户统一认证配置、LDAP用户数据获取、用户信息同步、LDAP与SLURM用户统一管理、个性化定制管理;解决现有技术中远程LDAP服务器配置无法改变、高性能云平台用户需求复杂、用户量大管理困难等问题,便于高性能云平台的存储与计费统一;满足用户的个性化需求,为计算量大,计算频繁的用户提供优质服务;用户资源管理更加合理有效;有效减少作业的排队时间,提高资源的利用率和高性能云平台的作业吞吐量。
-
公开(公告)号:CN114281874B
公开(公告)日:2024-12-10
申请号:CN202111373725.1
申请日:2021-11-19
Abstract: 本发明涉及数据索引领域,具体是涉及一种基于昇腾AI处理器的索引转换方法及装置。本发明根据张量的数据排布格式,对算子的索引信息进行转换,使得转换之后的索引信息与张量的数据排布格式所匹配,由于对索引信息进行转换只涉及到对数字的简单运算,从而在不改变张量数据排布格式的前提下,依然能够通过转换之后的索引信息在张量中索引到相应的数据。由于本发明不涉及到改变张量数据排布格式,从而避免了因改变张量数据排布格式而耗费的时间,进而提高了算子的计算速度。
-
公开(公告)号:CN112882828B
公开(公告)日:2023-09-05
申请号:CN202110096508.6
申请日:2021-01-25
Applicant: 北京大学
IPC: G06F9/50
Abstract: 本发明公开了基于SLURM作业调度系统的昇腾处理器管理和调度方法,将昇腾处理器作为与GPU类似的NPU,通过SLURM中的GRES插件来对NPU进行管理调度,实现对昇腾处理器进行管理和调度,其具体步骤包括:添加NPU插件模块、添加作业申请NPU资源功能、GRES插件添加NPU模块、重编译SLURM源代码、修改SLURM配置文件、启动SLURM服务。本发明将昇腾处理器作为一种GRES通用资源,用SLURM进行调度,这是首次将昇腾处理器与高性能集群的作业调度系统结合,使得昇腾处理器能够快速应用到跨节点超大规模计算场景中,拓宽昇腾处理器的应用场景,丰富高性能集群的资源类别,提高高性能集群计算力、节约作业计算时间。
-
公开(公告)号:CN112882828A
公开(公告)日:2021-06-01
申请号:CN202110096508.6
申请日:2021-01-25
Applicant: 北京大学
IPC: G06F9/50
Abstract: 本发明公开了基于SLURM作业调度系统的昇腾处理器管理和调度方法,将昇腾处理器作为与GPU类似的NPU,通过SLURM中的GRES插件来对NPU进行管理调度,实现对昇腾处理器进行管理和调度,其具体步骤包括:添加NPU插件模块、添加作业申请NPU资源功能、GRES插件添加NPU模块、重编译SLURM源代码、修改SLURM配置文件、启动SLURM服务。本发明将昇腾处理器作为一种GRES通用资源,用SLURM进行调度,这是首次将昇腾处理器与高性能集群的作业调度系统结合,使得昇腾处理器能够快速应用到跨节点超大规模计算场景中,拓宽昇腾处理器的应用场景,丰富高性能集群的资源类别,提高高性能集群计算力、节约作业计算时间。
-
-
-
-
-
-
-
-
-