-
公开(公告)号:CN120011080A
公开(公告)日:2025-05-16
申请号:CN202510169862.5
申请日:2025-02-14
Applicant: 联想(北京)有限公司 , 上海交通大学
IPC: G06F9/50
Abstract: 本申请公开了一种资源调度方法和装置,该方法包括:获得业务组件对应的至少一种资源的历史资源使用序列,历史资源使用序列包括业务组件在至少一个历史时间点上使用资源的历史使用量;基于资源的历史资源使用序列,利用资源预测模型确定业务组件待使用资源的预测资源使用量;基于各种资源的预测资源使用量以及业务组件对应的实例规格要求,确定业务组件对应的实例资源调整方案,实例规格要求用于表征运行业务组件的实例能够具有每种资源的资源量上限和资源量下限;按照实例资源调整方案,调整业务组件具有的实例资源。
-
公开(公告)号:CN119203047A
公开(公告)日:2024-12-27
申请号:CN202310754097.4
申请日:2023-06-25
Applicant: 上海交通大学
Abstract: 一种面向动态性特征的微服务应用优化资源管理系统及方法,包括:基于网络的负载监控器、感知阻塞的负载更新器和资源高效的请求清空器,当微服务应用出现负载和调用图动态性时,负载监控器根据每个微服务的网络监控数据,解析得到网络流量和网络包,通过机器学习中的线性回归技术预测得到监控负载;负载更新器根据监控负载和通过微服务间的调用关系和调用顺序构建的阻塞图,计算每个微服务的真实待处理负载,并为其分配相应资源量;请求清空器根据负载更新器输出的每个微服务的真实负载及当前资源分配信息,计算在剩余QoS恢复时间内每个微服务的过量负载,并为每个微服务分配过量资源,实现快速恢复应用的QoS目标。本发明在无需对于微服务应用进行代码修改的情况下,既可在微服务应用动态性下快速恢复应用的QoS目标,又可以最小化资源分配量以保持资源效率,可以为云数据中心中微服务应用发生负载和调用图动态性时的优化资源管理技术落地提供支持。
-
公开(公告)号:CN118607618A
公开(公告)日:2024-09-06
申请号:CN202410782352.0
申请日:2024-06-18
Applicant: 上海交通大学
IPC: G06N3/098 , G06F21/62 , H04L67/10 , G06N3/0442 , G06N3/0464
Abstract: 本发明提供参数粒度自适应调频的联邦学习方法及系统,包括:服务器选择每轮参与训练的客户端,将每个参数同步频率的更新信息传输到被选择的客户端;客户端的模型训练进程从通讯守护进程接收聚合的参数,根据每个参数的同步频率进行同步训练;通讯守护进程接收完成训练的参数,与服务器通讯进行聚合,再从服务器接收聚合后的参数并在下一轮训练时返回给模型训练进程;在聚合时,服务端计算梯度冲突率,当某个参数的梯度冲突率小于阈值时,将该参数的同步频率增倍,在下一轮训练时传输需要更新频率的参数的位置到所有的客户端中。本发明采用参数粒度的调频方式,对每个参数进行更准确的频率设置,保证训练效率的同时,提高最终模型的收敛准确率。
-
公开(公告)号:CN115981825B
公开(公告)日:2023-08-01
申请号:CN202310065956.9
申请日:2023-02-06
Applicant: 上海交通大学
Abstract: 一种基于混合式共享视图架构下的集群资源并行调度系统,包括:阴影资源管理器、资源挖掘调度器、资源挖掘任务过滤器、状态回声模块。本发明针对共享视图调度架构下难以被利用的阴影资源,在原有的共享视图调度架构上进行升级,有效地降低大规模集群高并行度时调度的冲突,提升集群在调度时延、任务吞吐率、资源利用率等各方面的性能。
-
公开(公告)号:CN115981825A
公开(公告)日:2023-04-18
申请号:CN202310065956.9
申请日:2023-02-06
Applicant: 上海交通大学
Abstract: 一种基于混合式共享视图架构下的集群资源并行调度系统,包括:阴影资源管理器、资源挖掘调度器、资源挖掘任务过滤器、状态回声模块。本发明针对共享视图调度架构下难以被利用的阴影资源,在原有的共享视图调度架构上进行升级,有效地降低大规模集群高并行度时调度的冲突,提升集群在调度时延、任务吞吐率、资源利用率等各方面的性能。
-
公开(公告)号:CN111597048B
公开(公告)日:2022-09-23
申请号:CN202010413443.9
申请日:2020-05-15
Applicant: 上海交通大学
Abstract: 本发明提供一种基于服务质量的微服务调度方法、系统及电子设备,所述方法包括:在Serverless模式下,根据运行时特征采集数据,获取当前微服务请求的实际平均到达率λ;根据决策函数、微服务请求的平均服务速率和服务质量目标,计算出切换所需要达到的平均到达率λ(μ);若微服务请求的实际平均到达率λ小于等于切换所需要达到的平均到达率λ(μ),则保持微服务部署于Serverless模式,若微服务请求的实际平均到达率λ大于切换所需要达到的平均到达率λ(μ),则调整微服务部署于IaaS模式。本发明实现了动态部署IaaS模式和Serverless模式的切换。
-
公开(公告)号:CN113407313B
公开(公告)日:2022-05-17
申请号:CN202011357682.3
申请日:2020-11-27
Applicant: 上海交通大学
Abstract: 本发明提供一种资源需求感知的多队列调度方法、系统及服务器,所述方法包括:获取用户提交的任务,并判断任务为CPU任务或GPU任务;在任务为GPU任务时,基于调整CPU核数并检查GPU利用率确定最优的CPU配置,进入GPU任务任务调度;在任务为CPU任务时,直接进入CPU任务调度;执行GPU任务调度:对CPU资源划进行划分,并根据当前CPU任务队列和GPU任务队列的排队状况调整CPU资源队列;对GPU资源划进行划分,并根据当前GPU任务队列的排队状况调整GPU资源队列;消除GPU任务与CPU任务在同一个节点上的内存系统的竞争。本发明可以在无需用户感知的前提下,最大化系统的吞吐和最小化系统的排队。
-
公开(公告)号:CN114205419A
公开(公告)日:2022-03-18
申请号:CN202111524128.4
申请日:2021-12-14
Applicant: 上海交通大学
Abstract: 一种面向微服务多维扰动特征的数据中心请求调度系统及方法,包括:微服务特征获取模块、微服务并行化模块和运行时优化模块,其中:微服务特征获取模块采集并刻画微服务的内部运行逻辑、微服务运行时间与资源供给关系以及微服务所处的网络条件三个方面的扰动特征;微服务并行化模块根据请求调用的微服务的扰动特征的互补性编排为最优的微服务并行化流水线各阶段;运行时优化模块解决微服务并行化流水线在实际运行时因扰动特征而造成的时间变化实时问题、资源变化实时问题和顺序变化实时问题;本发明通过采集并刻画不同微服务运行时的多维扰动特征并针对微服务运行时的多维扰动特征进行一种并行化的互补调度,搭建不同请求调用的不同微服务间的并行化流水线;本发明能够提高微服务架构应用请求调度的资源利用率和吞吐量。
-
公开(公告)号:CN114035935A
公开(公告)日:2022-02-11
申请号:CN202111193853.8
申请日:2021-10-13
Applicant: 上海交通大学
Abstract: 本发明提供一种面向多阶段AI云服务的高吞吐异构资源管理方法及器件,所述面向多阶段AI云服务的高吞吐异构资源管理方法包括:利用一服务质量目标分配器基于接收到的LC服务的请求将服务质量目标拆分为CPU侧服务质量目标和GPU侧服务质量目标;利用一异构资源管理器以CPU侧服务质量目标和GPU侧服务质量目标作为初始样本搜索最佳资源分配;利用一服务质量补偿器实时监测CPU阶段的进度,并在用户请求在CPU阶段花费的时间超过其CPU的服务质量目标时,加速其在加速器端的执行。本发明既保证LC服务的服务质量,又极大地提高了异构设备上所有BE应用的综合性能。
-
公开(公告)号:CN109947619B
公开(公告)日:2021-07-13
申请号:CN201910164582.X
申请日:2019-03-05
Applicant: 上海交通大学
Abstract: 本发明提供一种基于服务质量感知提高吞吐量的多资源管理系统及服务器,所述基于服务质量感知提高吞吐量的多资源管理系统包括:在线预测器,用于根据预设预测模型预测每个延迟敏感型应用请求在给定资源配置下的运行时间;资源分配器,用于根据预测的所述运行时间为所述延迟敏感型应用请求分配满足服务质量的资源配置;动态QoS监视器,用于确定当前的内存带宽竞争是否会引起QoS违例,并在确定当前的内存带宽竞争会引起QoS违例时对所述资源配置进行调整。本发明在保证延迟敏感型应用的服务质量的提前下,极大提高了批处理任务的吞吐量,有效解决了现有技术中在保证应用的服务质量过程中资源利用率低的问题。
-
-
-
-
-
-
-
-
-