一种大规模微服务智能多资源协同调度方法及系统

    公开(公告)号:CN115037749B

    公开(公告)日:2023-07-28

    申请号:CN202210644605.9

    申请日:2022-06-08

    Abstract: 本发明涉及一种大规模微服务智能多资源协同调度方法及系统,包括:采集微服务资源使用信息与微服务运行时信息并进行数据预处理;对资源协同调度进行决策的性能感知的多层联动;对微服务进行资源调度的资源分配。通过自动的信息采集可以实时地感知微服务的资源使用和延迟性能等情况;在此基础上,利用多智能体深度强化学习方法可以捕获各个微服务之间的依赖关系,并根据工作负载的动态变化协同地对每个微服务所使用的多种资源进行弹性细粒度的调整。本发明可以在尽可能保障大规模微服务应用的尾延迟SLO的同时,降低微服务每个资源维度的资源冗余,进而提高整体资源利用率。

    一种HTCondor超算网格文件传输方法及系统

    公开(公告)号:CN115051980B

    公开(公告)日:2023-06-30

    申请号:CN202210444495.1

    申请日:2022-04-26

    Abstract: 本公开提供了一种HTCondor超算网格文件传输方法及系统,其属于超算技术领域,所述方案应用于安装有HTCondor的计算节点,所述若干计算节点组成计算系统,所述方法包括:判断当前计算节点的计算是否正常结束;对于计算正常结束的计算节点,基于HTCondor回传机制完成计算结果文件的回传;对于计算异常终止的计算节点,基于预先设定的打包文件名称,将当前节点产生的结果文件、日志文件以及错误文件分别进行压缩打包;对于打包后的文件,基于HTCondor回传机制,实现全部计算文件的回传。

    一种基于作业功耗预测的节能调度方法及系统

    公开(公告)号:CN115220900B

    公开(公告)日:2022-12-13

    申请号:CN202211138391.4

    申请日:2022-09-19

    Abstract: 本发明公开了一种基于作业功耗预测的节能调度方法及系统,涉及高性能计算数据中心节能领域。通过资源监控模块,功耗预测模块和作业调度模块三个模块实现了数据的监控和功耗的预测,进而根据预测结果实现了作业调度。在节能调度方法中基于机器学习对作业队列中的作业功耗进行预测,使得预测结果比传统的理论模型更加准确,根据预测结果对负载作业和负载机柜进行分类,将高负载作业和低负载作业以轮询的方式分别分配给高负载机柜和低负载机柜,可以保证HPC数据中心的整体负载均衡。在机柜内将服务器划分为高温服务器和低温服务器,将作业优先分配给低温服务器可以防止机柜内出现局部温度过高的情况,有效避免了热点的出现。

    一种在超算互联网中超算中心数据备份的方法及装置

    公开(公告)号:CN115242806A

    公开(公告)日:2022-10-25

    申请号:CN202210669160.X

    申请日:2022-06-14

    Abstract: 本发明提供一种在超算互联网中超算中心数据备份的方法及装置,方法包括:将多个超算中心部署在不同的区域,各个超算中心通过超算互联网相互连通,处于受灾区域的超算中心为受灾超算中心,接收受灾超算中心发送的备份数据的超算中心为备份超算中心;设置最小化数据备份时间机制;当灾难警报触发时,受灾超算中心根据启动的最小化数据备份时间机制选择备份超算中心和相应的备份路径将数据进行备份。本发明将各个超算中心部署在不同的区域,在灾难将要发生时,受灾的超算中心将数据快速备份到其他的超算中心,并设置最小化数据备份时间机制,以实现分布式超算互联网中所有的超算中心的灾难数据备份和最小化数据备份时间,提高数据安全性。

Patent Agency Ranking