算力资源调度方法、装置以及电子设备

    公开(公告)号:CN119338181A

    公开(公告)日:2025-01-21

    申请号:CN202411431886.5

    申请日:2024-10-14

    Abstract: 本公开提供了一种基于区域算力资源效能评估的算力资源调度方法、装置以及电子设备,涉及算力资源调度技术领域,提出利用多维度评估策略,确定各区域的算力资源类型;根据数据调取频次以及实时调取需求,对各区域的算力需求进行归类;当算力资源需求型的区域提出算力需求请求、且请求属于温数据需求类或冷数据需求类时,将其算力需求与预设范围内的算力资源供给型的若干区域相匹配,得到算力调度方案,进而最大程度地解决了当前算力资源不均衡、集中供给无需求、集中需求无响应等问题。本公开弥补了业内尚未存在的从区域算力需求出发,匹配目标供给区域,辅助设定范围内算力资源调度以实现全局最优解的空白。

    大模型智能算力需求测算方法、装置、设备、介质及产品

    公开(公告)号:CN118863060A

    公开(公告)日:2024-10-29

    申请号:CN202411029930.X

    申请日:2024-07-30

    Abstract: 本发明提供一种大模型智能算力需求测算方法、装置、设备、介质及产品,包括:获取多个大模型的模型信息;根据模型信息,测算各个大模型的训练阶段智能算力需求和推理阶段智能算力需求;根据各个大模型所属行业场景的本地化需求比例、各个大模型的训练阶段智能算力需求和推理阶段智能算力需求,测算大模型本地化智能算力总需求。本发明通过测算训练和推理阶段智能算力需求,考虑了大模型不同阶段的特征差异;通过根据大模型所属行业场景的本地化比例、训练和推理阶段智能算力需求,对大模型本地化智能算力总需求进行测算,考虑了不同场景下大模型对智能算力时延及智算中心位置的需求,从而提高测算结果准确性,避免大模型智能算力资源不足的问题。

Patent Agency Ranking