融合媒体面网元过载保护方法、装置、设备及存储介质

    公开(公告)号:CN118804089A

    公开(公告)日:2024-10-18

    申请号:CN202410090401.4

    申请日:2024-01-22

    Abstract: 本申请涉及通信技术领域,提供一种融合媒体面网元过载保护方法、装置、设备及存储介质。该方法包括:监测融合媒体面用于表征融合媒体面网元的内置UMF负载情况的关键性能指标,以确定内置UMF是否满足过载保护机制的预设启动条件;若满足,执行倒换流程对内置UMF进行分流,以对融合媒体面网元进行过载保护。通过监测融合媒体面的关键性能指标,在融合媒体面网元的内置UMF满足过载保护机制的启动条件时,执行倒换流程对内置UMF进行分流,动态调整融合媒体面网元的内部转发与外部转发的媒体转发机制,不仅可以对内置UMF进行主动过载保护,还能避免丢包等异常情况的产生,以及避免融合网元故障,从而保证业务的正常进行。

    虚拟机的扩缩容方法、装置、设备和介质

    公开(公告)号:CN117149342A

    公开(公告)日:2023-12-01

    申请号:CN202210568359.3

    申请日:2022-05-23

    Abstract: 本发明公开了一种虚拟机的扩缩容方法、装置、设备和介质,所述方法包括:确定虚拟机的业务承载量,所述业务承载量包括实际业务承载量和/或预测业务承载量,所述预测业务承载量由所述实际业务承载量预测得到的;当所述业务承载量与CPU负荷存在线性函数关系时,根据所述线性函数关系确定CPU利用率,并获取主用虚拟机数;根据所述CPU利用率确定所述虚拟机的扩容门限,根据所述CPU利用率和所述主用虚拟机数确定缩容门限;根据所述扩容门限和所述缩容门限对所述虚拟机的数量进行调整。本发明使得虚拟机的容量调整更加准确。

    资源调度方法、系统、计算设备及存储介质

    公开(公告)号:CN118585284A

    公开(公告)日:2024-09-03

    申请号:CN202310217920.8

    申请日:2023-03-03

    Abstract: 本发明公开了一种资源调度方法、系统、计算设备及存储介质。方法包括:网络功能虚拟化编排器接收虚拟化网络功能管理器发送的针对目标网元的第一资源请求,基于第一资源请求创建目标网元的各个第二资源请求;网络功能虚拟化编排器生成包含目标网元标识的第一标签,并针对于任一第二资源请求,将第一标签嵌入第二资源请求后生成第三资源请求;虚拟化基础设施管理器根据第三资源请求中的第一标签将第三资源请求加入对应的请求队列中;虚拟化基础设施管理器依次对各个请求队列进行资源调度。本方案实现了虚拟化网元中多个请求的批量调度,相比资源预留的调度方式能提高虚拟化网元资源调度的成功率、优化资源调度的结果及提升资源池使用效率。

    模型推理的调度方法、装置、系统、介质、产品及设备

    公开(公告)号:CN118869816A

    公开(公告)日:2024-10-29

    申请号:CN202410856703.8

    申请日:2024-06-28

    Abstract: 本申请公开了一种模型推理的调度方法、装置、系统、介质、产品及设备,该方法包括:接收来自于推理请求端的第一调度请求消息,第一调度请求消息用于指示至少一个地域及其各自的推理请求数量;基于第一调度请求消息,从待调度服务端中确定出第一目标服务端;返回第一调度响应消息给推理请求端,第一调度响应消息携带第一目标服务端的第一信息,从而使得调度端能够因应推理请求端针对所需完成的推理任务的关于不同地域及其推理请求数量的需求来选出合适的第一目标服务端以供推理请求端完成推理任务,也可以实现推理请求端只需发送一次第一调度请求消息即可完成针对一个或多个地域的推理任务的地域批量调度以降低地域批量调度场景下的调度延迟。

    推理重调度方法、装置、设备、介质及计算机程序产品

    公开(公告)号:CN118798355A

    公开(公告)日:2024-10-18

    申请号:CN202410723443.7

    申请日:2024-06-05

    Abstract: 本发明提供一种推理重调度方法、装置、设备及可读存储介质。应用于包括推理调度器和多个推理服务器的推理调度系统。方法包括:在推理调度器与服务注册中心合设的情况下,基于每个推理服务器上报的负载状态信息,确定待重调度的第一推理服务器以及接收重调度的目标推理服务器;在推理调度器与推理服务器的流量网关合设的情况下,基于推理调度器记录的每个推理服务器的请求处理信息,确定待重调度的第一推理服务器以及接收重调度的目标推理服务器;基于第一推理服务器的请求排队时间信息,以及目标推理服务器的请求数量信息,将第一推理服务器的待重调度请求发送给目标推理服务器。本申请提升了推理重调度的整体性能。

    一种性能测算方法、装置、电子设备和存储介质

    公开(公告)号:CN118796673A

    公开(公告)日:2024-10-18

    申请号:CN202410431913.2

    申请日:2024-04-11

    Abstract: 本公开提供了一种性能测算方法、装置、电子设备和存储介质。该方法包括:获取待测模型的模型超参数与运行环境信息;基于所述运行环境信息与所述模型超参数进行计算,得到所述待测模型的性能测算结果;所述性能测算结果包括如下至少一种:显存占用、作业时长、吞吐量、分布式策略;输出所述性能测算结果。这样,通过获取待测模型的模型超参数和运行环境信息直接进行理论计算,得到性能测算结果。以此,就不需要搭建计算环境进行真实的测算,有助于提前预测和优化模型性能,降低了成本以及技术难度,提高了测算的效率,满足了开发需求。

Patent Agency Ranking