-
公开(公告)号:CN116185610A
公开(公告)日:2023-05-30
申请号:CN202211692197.0
申请日:2022-12-28
Abstract: 本发明提供一种基于神经网络中静态计算图的内存优化方法及电子设备,所述方法包括:识别神经网络静态计算图中前向兼容算子;消除与所述前向兼容算子对应的与后向自动微分相关的子图;生成与所述前向兼容算子对应的前向求导子图,并输出当前的神经网络静态计算图。本发明能够在不引入额外计算开销的情况下,通过自动优化静态计算图有效降低大部分神经网络激活函数的内存占用;本发明为大模型在内存受限设备上进行训练提供了有效支持,为新型激活函数的大规模应用铺平了道路,为大型神经网络基于静态计算图的训练节约了大量内存资源。
-
公开(公告)号:CN111046928B
公开(公告)日:2023-05-23
申请号:CN201911179354.6
申请日:2019-11-27
Applicant: 上海交通大学
IPC: G06V10/764 , G06V10/77 , G06V10/75 , G06V10/82 , G06N5/04 , G06N3/045 , G06N3/084 , G06N3/0464 , G06N3/048
Abstract: 一种定位更精准的单阶段实时通用目标检测器及方法,包括:检测骨干网络模块、特征增强模块和回归框重叠度引导训练及推理模块,特征增强模块使各层特征语义以及局部信息更丰富,取得更好的预测结果;对于大量的重叠框,通过将分类置信度与回归框定位置信度相乘,对分类置信度高而回归不精确的框进行更多的衰减,尽可能保留更精准的预测框。同时重叠度引导的交叉熵损失在训练中提高分类回归任务的相关性,抑制低质量预测结果,提升检测效果。
-
公开(公告)号:CN114205419B
公开(公告)日:2023-04-18
申请号:CN202111524128.4
申请日:2021-12-14
Applicant: 上海交通大学
Abstract: 一种面向微服务多维扰动特征的数据中心请求调度系统及方法,包括:微服务特征获取模块、微服务并行化模块和运行时优化模块,其中:微服务特征获取模块采集并刻画微服务的内部运行逻辑、微服务运行时间与资源供给关系以及微服务所处的网络条件三个方面的扰动特征;微服务并行化模块根据请求调用的微服务的扰动特征的互补性编排为最优的微服务并行化流水线各阶段;运行时优化模块解决微服务并行化流水线在实际运行时因扰动特征而造成的时间变化实时问题、资源变化实时问题和顺序变化实时问题;本发明通过采集并刻画不同微服务运行时的多维扰动特征并针对微服务运行时的多维扰动特征进行一种并行化的互补调度,搭建不同请求调用的不同微服务间的并行化流水线;本发明能够提高微服务架构应用请求调度的资源利用率和吞吐量。
-
公开(公告)号:CN111597045B
公开(公告)日:2023-04-07
申请号:CN202010412531.7
申请日:2020-05-15
Applicant: 上海交通大学
IPC: G06F9/50
Abstract: 本发明提供一种管理混合部署的共享资源管理方法、系统及服务器系统,所述管理混合部署的共享资源管理方法包括:接收用户云服务请求,并将所述用户云服务请求分配至对应的节点服务器,其中,不同的云服务与后台批处理任务部署于不同的节点服务器;接收所述用户云服务请求的节点服务器在检测到负载变化后,搜索当前负载下的一组最佳资源配置并应用;监测云服务质量,并在云服务质量违例时,从后台批处理任务处回收资源补偿云服务,直至云服务质量得到满足。本发明在无需升级硬件设备与不增加数据中心额外负担的提前下,在同时保证云服务的服务质量、满足服务器能耗限制的基础上,最大化后台批处理任务的吞吐量。
-
公开(公告)号:CN115914577A
公开(公告)日:2023-04-04
申请号:CN202211422929.4
申请日:2022-11-15
Applicant: 上海交通大学
Abstract: 一种轻量级分类垃圾图像自动采集系统,包括:垃圾信息采集终端、数据传输决策系统和云端服务器,其中:垃圾信息采集终端根据投递检测算法从红外测距数据中识别出投递行为后,对投递行为进行拍摄得到垃圾图像;数据传输决策系统根据终端当前的网络环境,通过决策得到匹配的传输方式将垃圾图像传输到云端;云端服务器根据收到的垃圾图像信息,进行图像识别处理,得到本次投递是否合格的结果。本发明能够自动检测垃圾房的投递行为,对投递的垃圾进行图像采集并传输,由云端服务器对投递质量进行判断的系统。
-
公开(公告)号:CN115904666A
公开(公告)日:2023-04-04
申请号:CN202211620686.5
申请日:2022-12-16
Applicant: 上海交通大学
Abstract: 一种面向GPU集群的深度学习训练任务调度系统,包括:离线性能刻画模块和在线任务调度部署模块,离线性能刻画模块分别预测不同训练任务的相似度以确定新提交任务的待采集硬件指标集以及两个训练任务混合部署后产生的性能下降程度,即性能干扰度,并离线采集训练任务在独占GPU模式下不同批大小的计算时间以拟合得到其批大小‑计算时间关系;在线任务调度部署模块从任务队列中取出待调度任务并根据批大小‑计算时间关系以及性能干扰度生成待调度任务的GPU亲和性和批大小分布策略,根据用户提交的训练任务及用户指定的GPU数量分为其分配合适的GPU,即混合部署后性能干扰最小的GPU以最小化平均作业完成时间并提高集群资源利用率,彻底解决GPU集群中,对于部分训练任务无法单独充分利用GPU资源和需要遵守组调度原则的条件下,最大化系统整体吞吐并提高集群资源利用率的问题。
-
公开(公告)号:CN115826873A
公开(公告)日:2023-03-21
申请号:CN202211700616.0
申请日:2022-12-28
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于图的纠删码快速恢复方法、系统及可读存储介质,方法包括以下步骤:S1、通过量化的方法收集系统参数以及各个节点的实时负载信息;S2、构建两个图模型,两个图模型分别对应恢复任务中源节点的选择和解码节点的选择;S3、使用最大流算法得到一个各个节点的可用带宽刚好被占满的最优解,即恢复调度方案;S4、根据恢复调度方案将各个恢复任务从选定的源节点发送给对应的解码节点进行数据块的读取,然后在解码节点上解码恢复完成后将数据写入系统设定的目标节点上。通过将各个节点的可用带宽放入图模型中进行调度,并基于最大流算法保证各个节点的任务调度不会超过其可用带宽,实现了更高维度的负载均衡,避免出现拥塞堵塞现象。
-
公开(公告)号:CN115495246A
公开(公告)日:2022-12-20
申请号:CN202211212624.0
申请日:2022-09-30
Applicant: 上海交通大学
Abstract: 一种分离式内存架构下的混合远内存调度方法,首先通过限制应用本地内存使用的方式收集运行时数据,从而将任务分为远内存不敏感型任务、远内存敏感型任务和远内存禁止使用型任务;根据敏感程度互补原则,将内存不敏感型任务和内存敏感型任务分配到同一个计算节点,根据任务在同等性能限制条件下的最大可让出内存,当对应的服务器之间的整体可出让内存值相差较大时进行跨节点的内存资源调整,确定服务器的出让的内存值或者租借的远内存值,之后进行节点内部的内存资源调整,根据服务器的当前剩余内存资源,按照敏感型任务更多额外本地内存资源的原则,为每个任务进行资源分配,实现混合远内存调度。本发明充分挖掘应用在远内存环境下的特点,继而通过高效的远内存分配策略,提升数据中心中的内存利用率和使用效率。
-
公开(公告)号:CN114691314A
公开(公告)日:2022-07-01
申请号:CN202111199598.8
申请日:2021-10-14
Applicant: 上海交通大学
Abstract: 本发明提供一种基于确定性算子共存的服务调度方法及其应用的GPU,所述基于确定性算子共存的服务调度方法包括:包括:利用一共存感知的延迟预测器预测每一个算子调度组的处理时间;利用一基于余量的请求控制器以轮循的方式调度多个深度学习服务的请求,在每一个轮次中,确定接收到的所有请求的处理顺序,并基于预测的所述每一个算子调度组的处理时间确定最佳的算子调度组;利用一分段模型执行引擎处理接收到的所述算子调度组中各请求的相应算子的计算。本发明保证了多个深度学习服务混合运行的服务质量保证,同时还提高了吞吐,提升了GPU利用率。
-
公开(公告)号:CN112925627B
公开(公告)日:2022-03-29
申请号:CN202110318094.7
申请日:2021-03-25
Applicant: 上海交通大学
Abstract: 一种基于图形处理器的图采样和随机游走加速方法及系统,通过CPU从存储介质中读取图数据并转化为CSR格式后输出至GPU,GPU根据设定的工作模式:实时生成别名表并进行采样;或离线判断是否已有预先生成的别名表并进行采样。本发明能够高效、并行地执行别名方法,能够在相同硬件平台上显著提升图数据处理的性能,包括提高采样吞吐量吞吐量,以及减少整体运行时间。
-
-
-
-
-
-
-
-
-