算力资源匹配方法、装置、设备、介质及计算机程序产品

    公开(公告)号:CN118796444A

    公开(公告)日:2024-10-18

    申请号:CN202410356098.8

    申请日:2024-03-27

    Abstract: 本申请涉及算力资源管理领域,提供一种算力资源匹配方法、装置、设备、介质及计算机程序产品。算力资源匹配方法包括:获取算力请求方的需求数据以及算力节点的算力资源;在多个算力请求方请求同一个算力节点的情况下,基于每个算力请求方的需求起止时间,确定多个算力请求方请求的算力节点的算力资源匹配方案;在多个算力请求方请求多个算力节点的情况下,对每个算力请求方的需求容量进行排序得到第一序列,对每个算力节点的算力资源进行排序得到第二序列;基于第一序列与第二序列的对应关系,确定每个算力节点的算力资源匹配方案。本申请通过对不同类型的算力请求分别制定算力资源匹配方案,提高了算力资源的利用率。

    算力资源调度方法、装置、设备及可读存储介质

    公开(公告)号:CN118644007A

    公开(公告)日:2024-09-13

    申请号:CN202410641372.6

    申请日:2024-05-22

    Abstract: 本申请涉及算力资源调度领域,提供一种算力资源调度方法、装置、设备及可读存储介质。算力资源调度方法包括:对接收的业务需求进行解析得到业务属性数据,基于所述业务需求确定目标算力需求任务;基于任务类型确定每个目标算力需求任务匹配的算力资源节点,得到匹配信息;所述任务类型是基于所述业务属性数据确定的;将所述匹配信息输入多目标算力资源调度模型,得到最优算力资源调度方案;所述多目标算力资源调度模型是基于历史算力需求任务和模糊综合评价算法构建得到的;基于所述最优算力资源调度方案确定提供给每个目标算力需求任务的算力资源。本申请通过对多个优化目标的综合评价,在解决算力资源调度问题的同时,使得多优化目标更均衡。

    大模型智能算力需求测算方法、装置、设备、介质及产品

    公开(公告)号:CN118863060A

    公开(公告)日:2024-10-29

    申请号:CN202411029930.X

    申请日:2024-07-30

    Abstract: 本发明提供一种大模型智能算力需求测算方法、装置、设备、介质及产品,包括:获取多个大模型的模型信息;根据模型信息,测算各个大模型的训练阶段智能算力需求和推理阶段智能算力需求;根据各个大模型所属行业场景的本地化需求比例、各个大模型的训练阶段智能算力需求和推理阶段智能算力需求,测算大模型本地化智能算力总需求。本发明通过测算训练和推理阶段智能算力需求,考虑了大模型不同阶段的特征差异;通过根据大模型所属行业场景的本地化比例、训练和推理阶段智能算力需求,对大模型本地化智能算力总需求进行测算,考虑了不同场景下大模型对智能算力时延及智算中心位置的需求,从而提高测算结果准确性,避免大模型智能算力资源不足的问题。

    算力资源调度方法、装置以及电子设备

    公开(公告)号:CN119338181A

    公开(公告)日:2025-01-21

    申请号:CN202411431886.5

    申请日:2024-10-14

    Abstract: 本公开提供了一种基于区域算力资源效能评估的算力资源调度方法、装置以及电子设备,涉及算力资源调度技术领域,提出利用多维度评估策略,确定各区域的算力资源类型;根据数据调取频次以及实时调取需求,对各区域的算力需求进行归类;当算力资源需求型的区域提出算力需求请求、且请求属于温数据需求类或冷数据需求类时,将其算力需求与预设范围内的算力资源供给型的若干区域相匹配,得到算力调度方案,进而最大程度地解决了当前算力资源不均衡、集中供给无需求、集中需求无响应等问题。本公开弥补了业内尚未存在的从区域算力需求出发,匹配目标供给区域,辅助设定范围内算力资源调度以实现全局最优解的空白。

Patent Agency Ranking