一种节点确定方法、装置、电子设备及存储介质

    公开(公告)号:CN112115030B

    公开(公告)日:2023-12-19

    申请号:CN202011045368.1

    申请日:2020-09-28

    Abstract: 本申请提供一种节点确定方法、装置、电子设备及存储介质。该方法包括:获取预设时间段内计算集群中各个计算节点的系统日志数据,系统日志数据中包括节点标识和对应的计算节点发生错误的指标名称;根据节点标识统计每个计算节点对应的各指标名称对应的系统日志数据的数量;根据各计算节点中,指标名称对应的优先级以及指标名称对应的系统日志数据的数量确定计算集群中的消极节点。本申请实施例中,由于不同指标名称对计算节点的性能影响不同,因此通过统计各个指标名称对应的系统日志数据的数量,从而能够高效地确定集群中各个计算节点的性能,进而获得消极节点。

    超算中心管理方法及装置
    53.
    发明公开

    公开(公告)号:CN116737492A

    公开(公告)日:2023-09-12

    申请号:CN202310659711.9

    申请日:2023-06-06

    Abstract: 本申请涉及一种超算中心管理方法及装置。该方法包括:在通过超算中心的数字孪生三维模型动态展示超算中心真实运行场景的情况下,基于数字孪生三维模型获取超算中心的实时运行监控数据,并根据超算中心的实时运行监控数据,对超算中心中的超计算集群进行管理。该方法不需要到现场对超算中心中的超计算集群进行管理,可以采用远程操控的方式对超算中心中的超计算集群进行管理,能够极大程度上提高超计算集群的管理速度和效率,再者,该方法通过超算中心的数字孪生三维模型模拟超算中心的真实运行场景,来获取超算中心对应的实时运行监控数据,可以提高实时运行监控数据的精准度,进而基于实时运行监控数据为基准,能够对超计算集群进行精准管理。

    一种集群性能的评价方法、装置、设备及存储介质

    公开(公告)号:CN113438110B

    公开(公告)日:2023-02-28

    申请号:CN202110696929.2

    申请日:2021-06-23

    Abstract: 本发明实施例公开了一种集群性能的评价方法、装置、设备及存储介质,该方法包括:确定待评价集群中的各个集群子系统,并基于集群子系统中的第一异常信息和/或第一可用信息确定集群子系统的质量评分,基于集群子系统中的第二异常信息和/或第二可用信息确定集群子系统的可用性评分;基于质量评分和可用性评分确定集群的性能评价结果,基于性能评价结果对集群进行运维;通过获取待评价集群的质量和可用性两个维度的评分,并获取最终的性能评价结果,实现了对待评价集群性能的准确评价,可以便于实现对待评价集群性能异常的及时告警,便于对待评价集群进行有效运营与维护,可以提升运维效率。

    一种在MESOS集群中集成高性能的作业调度框架的方法和装置

    公开(公告)号:CN108170417B

    公开(公告)日:2022-02-11

    申请号:CN201711476493.6

    申请日:2017-12-29

    Abstract: 本发明公开了一种在MESOS集群中集成高性能的作业调度框架的方法和装置,该方法包括:获取作业调度框架的作业信息,其中,作业信息包括作业调度框架上的作业的资源占用信息;将作业信息和MESOS集群中的可用资源信息相匹配;以及在作业信息和MESOS集群中的可用资源信息匹配成功后,将作业的资源占用信息同步到MESOS集群中,从而更新MESOS集群中的可用资源信息。本发明通过上述技术方案,从而实现了在Mesos集群集成了Slurm/PBS等高性能的作业调度框架,使得高性能作业可以在Mesos集群中运行并同步资源占用情况到Mesos集群中,进一步实现了超融合调度框架,使得高性能作业和其他作业可以在同一集群中运行且互不影响。

    一种集群性能的评价方法、装置、设备及存储介质

    公开(公告)号:CN113438110A

    公开(公告)日:2021-09-24

    申请号:CN202110696929.2

    申请日:2021-06-23

    Abstract: 本发明实施例公开了一种集群性能的评价方法、装置、设备及存储介质,该方法包括:确定待评价集群中的各个集群子系统,并基于集群子系统中的第一异常信息和/或第一可用信息确定集群子系统的质量评分,基于集群子系统中的第二异常信息和/或第二可用信息确定集群子系统的可用性评分;基于质量评分和可用性评分确定集群的性能评价结果,基于性能评价结果对集群进行运维;通过获取待评价集群的质量和可用性两个维度的评分,并获取最终的性能评价结果,实现了对待评价集群性能的准确评价,可以便于实现对待评价集群性能异常的及时告警,便于对待评价集群进行有效运营与维护,可以提升运维效率。

    一种开发代码的测试方法、装置、设备及存储介质

    公开(公告)号:CN113312267A

    公开(公告)日:2021-08-27

    申请号:CN202110661005.9

    申请日:2021-06-15

    Abstract: 本发明公开了一种开发代码的测试方法、装置、设备及存储介质,包括:获取与待测系统对应的开发代码,构建与所述开发代码匹配的测试环境;通过预设的测试组件,根据所述测试环境对所述开发代码进行测试,得到所述测试组件中的测试用例对所述开发代码的覆盖信息;根据所述测试组件中的测试用例对所述开发代码的覆盖信息,确定与所述开发代码对应的测试结果,并将所述测试结果展示给用户。本发明实施例的技术方案可以提高对开发代码的测试效率,以及开发代码测试结果的准确性。

    一种节点确定方法、装置、电子设备及存储介质

    公开(公告)号:CN112115030A

    公开(公告)日:2020-12-22

    申请号:CN202011045368.1

    申请日:2020-09-28

    Abstract: 本申请提供一种节点确定方法、装置、电子设备及存储介质。该方法包括:获取预设时间段内计算集群中各个计算节点的系统日志数据,系统日志数据中包括节点标识和对应的计算节点发生错误的指标名称;根据节点标识统计每个计算节点对应的各指标名称对应的系统日志数据的数量;根据各计算节点中,指标名称对应的优先级以及指标名称对应的系统日志数据的数量确定计算集群中的消极节点。本申请实施例中,由于不同指标名称对计算节点的性能影响不同,因此通过统计各个指标名称对应的系统日志数据的数量,从而能够高效地确定集群中各个计算节点的性能,进而获得消极节点。

    任务调度处理方法、装置、集群系统及可读存储介质

    公开(公告)号:CN112035238A

    公开(公告)日:2020-12-04

    申请号:CN202010957856.3

    申请日:2020-09-11

    Abstract: 本申请提供一种任务调度处理方法、装置、集群系统及可读存储介质,涉及集群任务处理技术领域。方法包括:获取集群系统中的调度节点发送的作业任务,作业任务为集群系统中的提交节点根据任务参数生成的HPC任务或AI任务;根据作业任务中的表征任务类型的标识,确定作业任务的任务类型;调用与任务类型对应的前处理组件,初始化任务环境,得到用于执行HPC任务或AI任务的运行环境;根据作业任务的任务内容,通过运行环境执行作业任务,得到执行结果,能够改善计算节点执行的任务类型单一,硬件资源利用率低的问题。

Patent Agency Ranking