-
公开(公告)号:CN119718539A
公开(公告)日:2025-03-28
申请号:CN202411673657.4
申请日:2024-11-21
Applicant: 上海交通大学 , 中国电信股份有限公司北京云科技研发中心
Abstract: 本申请提供一种服务器无感知安全容器的内存热插拔控制方法及电子设备,所述方法包括:所述方法包括:在接收到容器进程发起的内存分配请求时,基于CZone从可移动区域分配内存;在接收到函数容器分配请求时,基于RunD‑V调用CZone进行容器纵向扩展。本申请提供了一种有效的内存热插拔技术,最小化动态内存分配期间的性能下降,实现函数的多个副本容器能够在单个VM内通过纵向扩容降低VM的额外内存开销,加速运行时启动,可以为服务器无感知计算应用于高密度部署和高并发启动提供技术依托,可以构建具有商业意义的、基于混合资源扩展技术的服务器无感知计算系统,面向云服务提供商提供容器高效扩展服务。
-
公开(公告)号:CN115061775B
公开(公告)日:2024-06-04
申请号:CN202210590110.2
申请日:2022-05-26
Applicant: 上海交通大学
IPC: G06F9/455
Abstract: 本发明提供一种基于公有云的应用程序协同配置系统、方法及设备,所述基于公有云的应用程序协同配置系统包括:硬盘IO带宽分配模块,用于周期性地监视每个虚拟机的IO带宽使用情况,并基于虚拟机的IO带宽使用情况分配调整虚拟机的带宽;IO机制参数调优模块,用于基于虚拟机的带宽调整虚拟机的客户操作系统中的IO机制参数。本发明帮助各个IO密集型应用程序取得更高的性能,以此实现整体吞吐提高,本发明建立了迭代式软硬件协同配置运作框架,设计了无需入侵用户应用程序的参数调优方法,在无需升级硬件设备与不增加云服务提供商额外负担的提前下,提高了多租户公有云的整体吞吐。
-
公开(公告)号:CN111046928B
公开(公告)日:2023-05-23
申请号:CN201911179354.6
申请日:2019-11-27
Applicant: 上海交通大学
IPC: G06V10/764 , G06V10/77 , G06V10/75 , G06V10/82 , G06N5/04 , G06N3/045 , G06N3/084 , G06N3/0464 , G06N3/048
Abstract: 一种定位更精准的单阶段实时通用目标检测器及方法,包括:检测骨干网络模块、特征增强模块和回归框重叠度引导训练及推理模块,特征增强模块使各层特征语义以及局部信息更丰富,取得更好的预测结果;对于大量的重叠框,通过将分类置信度与回归框定位置信度相乘,对分类置信度高而回归不精确的框进行更多的衰减,尽可能保留更精准的预测框。同时重叠度引导的交叉熵损失在训练中提高分类回归任务的相关性,抑制低质量预测结果,提升检测效果。
-
公开(公告)号:CN114205419B
公开(公告)日:2023-04-18
申请号:CN202111524128.4
申请日:2021-12-14
Applicant: 上海交通大学
Abstract: 一种面向微服务多维扰动特征的数据中心请求调度系统及方法,包括:微服务特征获取模块、微服务并行化模块和运行时优化模块,其中:微服务特征获取模块采集并刻画微服务的内部运行逻辑、微服务运行时间与资源供给关系以及微服务所处的网络条件三个方面的扰动特征;微服务并行化模块根据请求调用的微服务的扰动特征的互补性编排为最优的微服务并行化流水线各阶段;运行时优化模块解决微服务并行化流水线在实际运行时因扰动特征而造成的时间变化实时问题、资源变化实时问题和顺序变化实时问题;本发明通过采集并刻画不同微服务运行时的多维扰动特征并针对微服务运行时的多维扰动特征进行一种并行化的互补调度,搭建不同请求调用的不同微服务间的并行化流水线;本发明能够提高微服务架构应用请求调度的资源利用率和吞吐量。
-
公开(公告)号:CN111597045B
公开(公告)日:2023-04-07
申请号:CN202010412531.7
申请日:2020-05-15
Applicant: 上海交通大学
IPC: G06F9/50
Abstract: 本发明提供一种管理混合部署的共享资源管理方法、系统及服务器系统,所述管理混合部署的共享资源管理方法包括:接收用户云服务请求,并将所述用户云服务请求分配至对应的节点服务器,其中,不同的云服务与后台批处理任务部署于不同的节点服务器;接收所述用户云服务请求的节点服务器在检测到负载变化后,搜索当前负载下的一组最佳资源配置并应用;监测云服务质量,并在云服务质量违例时,从后台批处理任务处回收资源补偿云服务,直至云服务质量得到满足。本发明在无需升级硬件设备与不增加数据中心额外负担的提前下,在同时保证云服务的服务质量、满足服务器能耗限制的基础上,最大化后台批处理任务的吞吐量。
-
公开(公告)号:CN115904666A
公开(公告)日:2023-04-04
申请号:CN202211620686.5
申请日:2022-12-16
Applicant: 上海交通大学
Abstract: 一种面向GPU集群的深度学习训练任务调度系统,包括:离线性能刻画模块和在线任务调度部署模块,离线性能刻画模块分别预测不同训练任务的相似度以确定新提交任务的待采集硬件指标集以及两个训练任务混合部署后产生的性能下降程度,即性能干扰度,并离线采集训练任务在独占GPU模式下不同批大小的计算时间以拟合得到其批大小‑计算时间关系;在线任务调度部署模块从任务队列中取出待调度任务并根据批大小‑计算时间关系以及性能干扰度生成待调度任务的GPU亲和性和批大小分布策略,根据用户提交的训练任务及用户指定的GPU数量分为其分配合适的GPU,即混合部署后性能干扰最小的GPU以最小化平均作业完成时间并提高集群资源利用率,彻底解决GPU集群中,对于部分训练任务无法单独充分利用GPU资源和需要遵守组调度原则的条件下,最大化系统整体吞吐并提高集群资源利用率的问题。
-
公开(公告)号:CN114691314A
公开(公告)日:2022-07-01
申请号:CN202111199598.8
申请日:2021-10-14
Applicant: 上海交通大学
Abstract: 本发明提供一种基于确定性算子共存的服务调度方法及其应用的GPU,所述基于确定性算子共存的服务调度方法包括:包括:利用一共存感知的延迟预测器预测每一个算子调度组的处理时间;利用一基于余量的请求控制器以轮循的方式调度多个深度学习服务的请求,在每一个轮次中,确定接收到的所有请求的处理顺序,并基于预测的所述每一个算子调度组的处理时间确定最佳的算子调度组;利用一分段模型执行引擎处理接收到的所述算子调度组中各请求的相应算子的计算。本发明保证了多个深度学习服务混合运行的服务质量保证,同时还提高了吞吐,提升了GPU利用率。
-
公开(公告)号:CN112529175B
公开(公告)日:2022-03-18
申请号:CN202011224090.4
申请日:2020-11-05
Applicant: 上海交通大学
Abstract: 本发明提供一种神经网络的编译方法、系统、计算机存储介质及编译设备,所述神经网络的编译方法包括:将网络文件翻译为中间表达文件;从性能分析、单节点以及多节点协同角度对所述中间表达文件进行优化;将优化后的中间表达文件生成基于硬件接口的网络模版文件;将所述网络模版文件编译为可执行推理应用。本发明旨在设计并实现一个能够自动根据软硬件信息调节参数、生成代码的编译工具链框架、中间表示以及相应优化算法,使之在目标芯片上计算时,在不改变网络输出结果的同时,在较短的优化时间内获得更高的计算速率、更小的计算时延。且方便用户自行调试、调参。
-
公开(公告)号:CN113064712A
公开(公告)日:2021-07-02
申请号:CN202110412428.7
申请日:2021-04-16
Applicant: 上海交通大学
Abstract: 本发明提供一种基于云边环境的微服务优化部署控制方法、系统及集群,所述基于云边环境的微服务优化部署控制方法包括:包括:将微服务应用划分成为多个子结构并将每个子结构映射到云边连续体的同一节点中;基于优化目标的约束为每个微服务细粒度的分配计算资源;监测每个节点的资源使用情况,在运行时发现资源使用不均衡时,将微服务从拥塞节点迁移至其他空闲节点。本发明可以解决微服务在云边连续体环境下的部署问题,以在保证用户请求端到端延迟要求的情况下最小化微服务的资源使用。
-
公开(公告)号:CN112817730A
公开(公告)日:2021-05-18
申请号:CN202110209701.6
申请日:2021-02-24
Applicant: 上海交通大学
Abstract: 本发明提供一种深度神经网络服务批处理调度方法、系统及GPU,所述深度神经网络服务批处理调度方法包括:构建包含多个批处理调度策略的批处理调度策略池;基于用户输入的服务质量要求信息和神经网络模型的类型确定对应的批处理调度策略,并配置所述确定的批处理调度策略;基于批处理调度策略的配置情况对所述神经网络模型执行服务调度。本发明可以为新兴的深度神经网络技术落地提供支持,可以构建具有商业意义的、基于模型多样性感知的深度神经网络服务批处理调度系统,面向用户简化神经网络推理调度服务的优化,优化整个神经网络的服务响应速度。
-
-
-
-
-
-
-
-
-