-
公开(公告)号:CN119536918A
公开(公告)日:2025-02-28
申请号:CN202510107481.4
申请日:2025-01-23
Applicant: 之江实验室 , 上海人工智能创新中心
Abstract: 本发明公开了一种PCIe设备远程控制方法、装置、电子设备、介质,所述装置包括:本地服务器和远端服务器;所述本地服务器上部署有PCIe硬件设备控制组件、虚拟PCIe总线、若干本地RDMA网卡;所述远端服务器上部署有PCIe硬件设备、PCIe硬件设备代理组件、若干远端RDMA网卡;所述PCIe硬件设备控制组件用于实现部署于远端服务器上的PCIe硬件设备在本地CPU上的虚拟PCIe设备呈现;所述虚拟PCIe总线用于为本地CPU管理虚拟PCIe总线及总线上的虚拟PCIe设备;所述PCIe硬件设备代理组件与部署于远端服务器上的PCIe硬件设备一一配对,用于完成远端RDMA网卡与PCIe硬件设备间的PCIe请求的代理转发。
-
公开(公告)号:CN118585342B
公开(公告)日:2024-11-05
申请号:CN202411058896.9
申请日:2024-08-02
Applicant: 之江实验室
Abstract: 本说明书公开了一种并行训练中的计算方法、装置、存储介质、设备,应用于模型并行训练,模型包括若干模型层,模型层被部署于若干计算节点中,每个计算节点中部署的模型层包括常规层和弹性层,弹性层根据该计算节点的后置节点的常规层确定,针对任一计算节点,根据当前批次的训练样本以及该计算节点上部署的常规层,得到该计算节点的计算结果,若该计算节点的后置节点已完成对前一批次的训练样本的计算,将计算结果作为输出结果,否则,根据计算结果以及该计算节点的弹性层,得到该计算节点的输出结果,将输出结果传输给所述后置节点,可动态监控和调整计算节点的负载,减少整体计算过程的计算等待时间。
-
公开(公告)号:CN117369962A
公开(公告)日:2024-01-09
申请号:CN202311149336.X
申请日:2023-09-07
Applicant: 之江实验室
IPC: G06F9/48 , G06N3/092 , G06N3/084 , G06N3/0442 , G06N3/0455
Abstract: 本申请涉及一种工作流执行序列生成方法、装置、计算机设备和存储介质。所述方法包括:获取工作流执行序列数据集,所述工作流执行序列数据集包括训练工作流描述和对应的标准工作流执行序列,基于所述工作流执行序列数据集训练初始模型,得到执行序列生成模型,将目标工作流需求描述输入所述执行序列生成模型,得到初始工作流执行序列,若所述初始工作流执行序列不满足预设要求,则将所述初始工作流执行序列输入执行序列优化模型,确定目标工作流执行序列,所述执行序列优化模型由强化学习模型训练得到。不仅提高了工作流执行序列生成效率,节省了大量的人力和时间,同时提高了资源利用率。
-
公开(公告)号:CN117215973A
公开(公告)日:2023-12-12
申请号:CN202311179609.5
申请日:2023-09-13
Applicant: 之江实验室
IPC: G06F12/084 , G06N3/098
Abstract: 本申请涉及一种缓存数据的处理方法、深度学习训练方法和系统。应用于本地节点,本地节点连接远程节点以及服务器,本地节点设置有本地命中缓存区和本地淘汰缓存区:从本地命中缓存区中读取第一已缓存数据,并得到当前读取数据;其中,第一已缓存数据包括已分配至本地节点并缓存在本地命中缓存区的第一历史训练数据,以及本地节点从远程节点预读取并缓存至本地命中缓存区的第二历史训练数据;在服务器基于当前读取数据生成深度学习模型的情况下,本地节点将当前读取数据转移至淘汰缓存区中,得到第二已缓存数据。采用本方法能够提高深度学习训练的效率。
-
公开(公告)号:CN117193796A
公开(公告)日:2023-12-08
申请号:CN202311089591.X
申请日:2023-08-28
Applicant: 之江实验室
Abstract: 本发明公开了一种应用的构建和部署以及辅助运行的系统和方法,包括应用管理模块、存储模块、节点代理模块、节点管理模块、边车组件、共用组件、转发管理模块,基于这些模块,用户提交应用构建部署请求,系统根据用户上传的软件包构建部署应用,并根据用户选择使用的共用组件列表同步部署边车组件。应用在实际运行时,向外部发出的请求均被边车组件捕获,若请求是发向共用组件的,则由边车组件根据最新的共用组件状态等相关信息,确定接收请求的共用组件,然后由边车组件向对应的共用组件转发请求为应用提供服务。该方法简便,在保证应用可用性的同时,进一步提升了计算资源的使用率。
-
公开(公告)号:CN119473637B
公开(公告)日:2025-05-02
申请号:CN202510064880.7
申请日:2025-01-15
Applicant: 之江实验室
IPC: G06F9/50 , G06N3/063 , G06N3/0464
Abstract: 本说明书公开了一种计算任务规划方法、装置、存储介质及电子设备,获取待计算的神经网络层的计算数据的数据尺寸,根据参与神经网络层计算的计算核的总数量,确定各计算核需承担的计算任务对应的数据尺寸,对计算核需承担的计算任务对应的数据尺寸进行划分,得到子任务数据的数据尺寸,使计算核的存储容量与进行子任务数据对应计算任务所需的存储空间之间的差值最小化。子任务数据的数据尺寸为在一个通信周期,计算核读取的数据量,因为进行子任务数据对应计算任务所需的存储空间之间的差值最小化,所以应用本说明书中的方法,能够在神经网络的计算过程中,充分利用计算核的存储容量,实现资源利用率的最大化,从而加快神经网络计算的速度。
-
公开(公告)号:CN119536918B
公开(公告)日:2025-04-11
申请号:CN202510107481.4
申请日:2025-01-23
Applicant: 之江实验室 , 上海人工智能创新中心
Abstract: 本发明公开了一种PCIe设备远程控制方法、装置、电子设备、介质,所述装置包括:本地服务器和远端服务器;所述本地服务器上部署有PCIe硬件设备控制组件、虚拟PCIe总线、若干本地RDMA网卡;所述远端服务器上部署有PCIe硬件设备、PCIe硬件设备代理组件、若干远端RDMA网卡;所述PCIe硬件设备控制组件用于实现部署于远端服务器上的PCIe硬件设备在本地CPU上的虚拟PCIe设备呈现;所述虚拟PCIe总线用于为本地CPU管理虚拟PCIe总线及总线上的虚拟PCIe设备;所述PCIe硬件设备代理组件与部署于远端服务器上的PCIe硬件设备一一配对,用于完成远端RDMA网卡与PCIe硬件设备间的PCIe请求的代理转发。
-
公开(公告)号:CN119166948A
公开(公告)日:2024-12-20
申请号:CN202411629645.1
申请日:2024-11-15
Applicant: 之江实验室
IPC: G06F17/10 , G06N3/0499 , G06N3/084 , G06N3/063
Abstract: 本发明公开一种众核环境下自适应的dw类型算子数据分布方法和装置,通过获取参与计算的硬件设备参数以及计算任务参数,根据x和dy的形状搜索适应硬件设备参数的数据分布;根据数据分布和单次取数大小,将输入数据划分为多个块进行计算,最后根据得到的数据分布选择规约维度和连接写回维度写回。本发明能够针对计算芯片和参与计算的数据参数,自适应的搜索适应计算的数据分布,从而减少了因数据分布不合理导致的额外数据传输的开销,从而优化了算子性能。
-
公开(公告)号:CN118585342A
公开(公告)日:2024-09-03
申请号:CN202411058896.9
申请日:2024-08-02
Applicant: 之江实验室
Abstract: 本说明书公开了一种并行训练中的计算方法、装置、存储介质、设备,应用于模型并行训练,模型包括若干模型层,模型层被部署于若干计算节点中,每个计算节点中部署的模型层包括常规层和弹性层,弹性层根据该计算节点的后置节点的常规层确定,针对任一计算节点,根据当前批次的训练样本以及该计算节点上部署的常规层,得到该计算节点的计算结果,若该计算节点的后置节点已完成对前一批次的训练样本的计算,将计算结果作为输出结果,否则,根据计算结果以及该计算节点的弹性层,得到该计算节点的输出结果,将输出结果传输给所述后置节点,可动态监控和调整计算节点的负载,减少整体计算过程的计算等待时间。
-
公开(公告)号:CN118862969B
公开(公告)日:2025-04-25
申请号:CN202411353441.X
申请日:2024-09-26
Applicant: 之江实验室
IPC: G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本说明书公开了一种模型运算优化方法、装置、存储介质及电子设备。在本说明书提供的模型运算优化方法中,获取目标模型,并确定所述目标模型中包含的运算功能;根据所述运算功能,确定执行所述运算功能所需的算子;对各算子中的至少部分算子进行拆分;根据所述各算子的输入、输出以及运算类型,对所述各算子与拆分后的算子进行融合,得到若干融合算子;采用所述融合算子执行所述目标模型中包含的所述运算功能。
-
-
-
-
-
-
-
-
-