一种面向智能计算的分布式模型训练容器调度方法及装置

    公开(公告)号:CN116167463B

    公开(公告)日:2023-07-07

    申请号:CN202310461389.9

    申请日:2023-04-26

    Abstract: 本说明书公开了一种面向智能计算的分布式模型训练容器调度方法及装置,将目标模型进行拆分,以得到各子模型,根据各个子模型,确定用于部署各个子模型的各计算节点,并在各计算节点上创建各容器,以将各子模型分别部署到所述各容器内。采用样本数据执行模型训练任务,以训练各容器内的部署的子模型。根据各计算节点的负载数据以及各容器对应的运算时长,确定出需要调整容器分布的计算节点,作为目标节点。以部署有子模型的各计算节点中的容器所对应的运算时长相接近为调整目标,对目标节点中各容器的分布进行调整;基于调整容器分布后的各计算节点,执行目标模型的训练任务。

    一种面向分布式集群的任务执行方法、装置、介质及设备

    公开(公告)号:CN116382599A

    公开(公告)日:2023-07-04

    申请号:CN202310669715.5

    申请日:2023-06-07

    Abstract: 本说明书公开了一种面向分布式集群的任务执行方法、装置、介质及设备。所述面向分布式集群的任务执行方法包括:获取样本数据,根据磁盘带宽和本地延迟,以及网络带宽和网络延迟,对样本数据的数量进行划分,将第一样本数量的样本数据存储在各计算节点的本地磁盘,将第二样本数量的样本数据存储在存储节点,针对每个计算节点,将该计算节点的本地磁盘中指定数量的样本数据与其他计算节点的本地磁盘中的样本数据进行交换,得到更新后样本数据,以及,从所述存储节点中读取远端样本数据,根据更新后本地样本数据和远端样本数据,在该计算节点上执行当前训练周期针对目标模型的训练任务。

    一种芯片电流的预测方法、装置、介质及电子设备

    公开(公告)号:CN116204387A

    公开(公告)日:2023-06-02

    申请号:CN202310461391.6

    申请日:2023-04-26

    Abstract: 本说明书公开了一种芯片电流的预测方法、装置、介质及电子设备,采用可解释人工智能技术,获取芯片中的任务负载状态以及指令集,该任务负载状态包括运算单元任务负载状态和缓存单元任务负载状态。将该芯片的任务负载状态输入到第一回归模型,以使第一回归模型确定该芯片维持该任务负载状态的所需电流。并将该指令集输入第二回归模型,以使第二回归模型确定该芯片执行该指令集中的指令后的电流变化值。根据该芯片维持该任务负载状态的所需电流以及该芯片执行该指令集中包含的指令后的电流变化值,以确定该芯片的增量电流。实现了对芯片维持作业的电流的预测,且因为第一回归模型与第二回归模型具备可解释性,提高了预测电流作业的可靠性及可控性。

    一种基于多模态学习的视频去重方法及装置

    公开(公告)号:CN116186330A

    公开(公告)日:2023-05-30

    申请号:CN202310442154.5

    申请日:2023-04-23

    Abstract: 本说明书公开了一种基于多模态学习的视频去重方法及装置,可以获取视频存储请求,而后,可以根据视频存储请求,确定待检测视频,以及确定数据库中的目标视频,进而,将待检测视频、待检测视频的文本相关信息输入到预先训练的识别模型中的第一特征提取网络,提取待检测视频的视觉‑文本多模态特征,将目标视频和目标视频的文本相关信息输入识别模型的第二特征提取网络,提取目标视频的视觉‑文本多模态特征。将待检测视频的视觉‑文本多模态特征以及目标视频的视觉‑文本多模态特征输入到识别模型中的重复检测子网络,得到重复检测结果,并根据该重复检测结果,确定是否将待检测视频存储在数据库中,从而能够提高视频去重的准确性。

    一种服务器集群资源的统一调度方法和装置

    公开(公告)号:CN115952008A

    公开(公告)日:2023-04-11

    申请号:CN202310247734.9

    申请日:2023-03-15

    Abstract: 本发明公开了一种服务器集群资源的统一调度方法和装置,该方法针对服务器资源调度的增量实时调度和全量碎片整理,合并简化了调度方法,实现了方法的复用;该方法包括以下步骤:获取当前时刻服务器集群状态的快照;根据快照,获取集群中的所有在运行的服务器集合,并根据优先级进行降序排列;依次遍历所排序的服务器集合,对每台服务器,通过弹射链和蒙特卡洛树搜索方法,依次判断所部署的容器是否可迁移至其它低优先级的服务器,并执行相应操作。本发明能获得完整的迁移路径和过程态,对服务器集群的资源进行整理,提高了资源的使用率,优化集群性能,降低功耗,助力实现数据中心的低碳节能、绿色环保的追求。

    基于概率的负载平衡方法及装置、电子设备、存储介质

    公开(公告)号:CN114079656A

    公开(公告)日:2022-02-22

    申请号:CN202210059029.1

    申请日:2022-01-19

    Inventor: 李勇 曾令仿 陈光

    Abstract: 本发明公开了一种基于概率的负载平衡方法及装置、电子设备、存储介质,包括:接收每个存储节点发送的负载信息;根据所述负载信息,计算每个存储节点的负载;根据所述负载,计算每个存储节点的负载服务能力;接收客户端发送的数据请求;根据所述负载服务能力,计算服务概率;基于所述服务概率,随机的选择一个存储节点服务所述数据请求,其中所述服务概率越大被选中的概率越高。本发明可以应用到各类分布式文件系统的中,解决负载信息收集的低网络开销和较好负载平衡效果之间难以兼顾的问题。

    深度学习数据集存取方法及系统、电子设备、存储介质

    公开(公告)号:CN113935476A

    公开(公告)日:2022-01-14

    申请号:CN202111542576.7

    申请日:2021-12-16

    Abstract: 本发明公开了一种深度学习数据集存取方法及系统、电子设备、存储介质,所述方法基于存储架构实现,存储架构包括内存层、非易失性内存层和原始数据存储层,方法包括:将原始数据存储层的最初的图片解码成RGB或灰度图,重定义图片大小,以统一的尺寸写入非易失性内存层,并根据RGB或灰度图在非易失性内存层中的地址空间生成索引,将索引写入非易失性内存层;记录每个RGB或灰度图的索引,根据索引,得到每个RGB或灰度图的访问顺序,在DNN模型的每个epoch开始时对索引进行更新;根据访问顺序,利用更新后的索引依次将非易失性内存层中的RGB或灰度图读入内存层中,供DNN模型进行训练。本发明能够显著提高数据DNN图片数据集的读吞吐,进而提升模型的整体训练速度。

Patent Agency Ranking