基于大模型意图感知的算力网络资源智能调度方法

    公开(公告)号:CN119759598B

    公开(公告)日:2025-05-09

    申请号:CN202510276809.5

    申请日:2025-03-10

    Abstract: 本发明涉及一种基于大模型意图感知的算力网络资源智能调度方法,属于算力网络资源自动配置技术领域,本发明充分利用大语言模型在意图识别方面的优势,以及智能体推理、规划等优势,并结合外部知识库扩展大语言模型的知识范围,从而提升回答准确性、减轻推理负担、增强动态更新能力,并提高对不同领域的适应性。通过与算网系统的有机结合,能够实现从用户自然语言描述到所需资源的自动化配置,简化操作流程、降低使用门槛,使更多用户能够轻松访问和使用丰富的算力资源。为降低在进行资源分配过程中无效的资源配置,提出了基于用户描述和模板的语法检查以及参数检查技术,从而提高程序的整体健壮性。

    基于大模型意图感知的算力网络资源智能调度方法

    公开(公告)号:CN119759598A

    公开(公告)日:2025-04-04

    申请号:CN202510276809.5

    申请日:2025-03-10

    Abstract: 本发明涉及一种基于大模型意图感知的算力网络资源智能调度方法,属于算力网络资源自动配置技术领域,本发明充分利用大语言模型在意图识别方面的优势,以及智能体推理、规划等优势,并结合外部知识库扩展大语言模型的知识范围,从而提升回答准确性、减轻推理负担、增强动态更新能力,并提高对不同领域的适应性。通过与算网系统的有机结合,能够实现从用户自然语言描述到所需资源的自动化配置,简化操作流程、降低使用门槛,使更多用户能够轻松访问和使用丰富的算力资源。为降低在进行资源分配过程中无效的资源配置,提出了基于用户描述和模板的语法检查以及参数检查技术,从而提高程序的整体健壮性。

    基于网络性能综合权值决策的算网调度服务方法及系统

    公开(公告)号:CN116708446A

    公开(公告)日:2023-09-05

    申请号:CN202310967433.3

    申请日:2023-08-03

    Abstract: 本发明涉及算力资源调度技术领域,提供了基于网络性能综合权值决策的算网调度服务方法及系统,算网服务平台将筛选出来的不属于同一数据中心的存储平台和算力平台进行一一组合,得到若干组存储平台和算力平台的组合;根据每一种组合下存储平台与算力平台之间的不同网络性能指标的数值、不同网络性能指标的主观权重向量、不同网络性能指标的客观权重向量以及用户客户端的资源需求,构建存算分离场景或数据流转场景下的多目标优化函数,对函数进行求解,得到满足用户需求的最佳存储平台和算力平台组合;算网服务平台将用户客户端的作业和计算数据,部署到最佳存储平台和算力平台组合中进行存储和计算。提高了计算资源利用率和任务调度效率。

    一种云计算资源弹性测评方法

    公开(公告)号:CN110278125B

    公开(公告)日:2022-03-29

    申请号:CN201910542314.7

    申请日:2019-06-21

    Inventor: 陈静

    Abstract: 本发明的云计算资源弹性测评方法,包括:a).在待测评的云计算平台上创建2个配置相同的集群;b).执行n次对两个集群施加相同负载和/或减少相同负载的测试,判断2个集群所增加或减少的虚拟机数量是否相等来评价云计算平台的资源配置准确度;c).判断2个集群增加或减少相同数量的虚拟机时,其所用时间差是否在设定时间范围内来评价资源配置速度;d).虚拟机性能指标测评;e).云计算平台资源弹性伸缩评价。本发明的云计算资源弹性测评方法,提出了一种简单、直观、实用的弹性测评方法,能够实现云计算资源弹性配置的快速测评,可快速确认云计算平台资源弹性是否有效、资源配置是否准确与及时、虚拟机性能的优劣。

    一种支持突发应急的云计算资源分配方法

    公开(公告)号:CN107967179B

    公开(公告)日:2021-08-06

    申请号:CN201711312598.8

    申请日:2017-12-12

    Abstract: 本发明的支持突发应急的云计算资源分配方法,包括:a).获取包括用户优先级、资源需求的紧迫程度、资源申请数量和配置在内的用户资源申请信息;b).计算用户资源分配优先级;c).获取可用物理服务器的资源信息;d).计算物理服务器的资源利用率;e).建立虚拟机性能匹配最优、虚拟机提供时间最短、平台总体负载变化最小的多目标函数以及约束条件;f).建立虚拟机请求与物理服务器的映射关系;g).进行资源分配。本发明的云计算资源分配方法,通过建立的多目标函数和约束条件,采用多目标优化算法得到一组解集,选择一个解作为映射方案,即可实现虚拟机的最优化布设。同时,该分配方法具有支持突发应急的功能,突发应急用户可优先被分配。

    一种基于复杂异构环境的微服务调度方法及其实现系统

    公开(公告)号:CN112068943A

    公开(公告)日:2020-12-11

    申请号:CN202010933828.8

    申请日:2020-09-08

    Abstract: 本发明涉及一种复杂异构环境下的微服务调度方法及其实现系统,包括:(1)第一级调度:实时获取所有物理服务器、虚拟机、服务及微服务的基本信息,将有调用关系的微服务调度到关系距离更近的虚拟机中;保证各个微服务之间调用的高性能;(2)第二级调度:在业务应用运行过程中,统计一个时间段内虚拟机之间通信的延时和微服务之间的调用频繁程度,动态更新虚拟机之间的关系距离矩阵,周期性检查并迁移符合条件的微服务,保证调用频繁的微服务迁移到关系距离较近的虚拟机上。通过对微服务的两级调度之后,保证微服务能够被调度到合适的虚拟机上,尽量减少微服务跨虚拟机、跨物理服务器、跨网段调用,达到微服务之间高效调用的效果。

    容器化算力环境的切换调度方法及系统

    公开(公告)号:CN119759599A

    公开(公告)日:2025-04-04

    申请号:CN202510277093.0

    申请日:2025-03-10

    Abstract: 本发明涉及一种容器化算力环境的切换调度方法及系统,属于云计算和容器化技术领域,包括:在异构算力环境资源切换之前,结合容器化技术设计适应不同资源的标准化镜像模板;在切换的过程中,通过持久化存储技术确保模型设计、模型训练、模型推理的整个过程中产生的数据在切换过程中的一致性和可用性;在切换的过程中,结合CRIU技术的进程状态保存与恢复机制实现任务的迁移,减少因环境切换造成的计算中断;在进行资源调度的过程中,通过预分配策略负责动态预测并根据任务的优先级合理调度任务所需的算力资源,最终完成异构算力环境下的资源切换和调度。本发明可有效提升资源的灵活调配能力,适应实例不同的任务需求,提高切换效率。

Patent Agency Ranking