-
公开(公告)号:CN119150953A
公开(公告)日:2024-12-17
申请号:CN202411176111.8
申请日:2024-08-26
Applicant: 中国科学院计算技术研究所
IPC: G06N3/098 , G06N3/082 , G06N3/0495 , G06F9/50
Abstract: 本发明提出一种分布式训练通信压缩方法、装置、分布式训练系统,该方法包含:将分布式集群中各节点的全局梯度信息进行分组;在每个分组内选择梯度绝对值最大的前K个梯度值,将其余未选中的梯度值置为0,生成稀疏梯度矩阵;在各节点之间共享该稀疏梯度矩阵。该方法可以有效地减少边缘设备训练集群中节点间的通信量,从而实现更高效的分布式协同训练,并且保持模型的精度。
-
公开(公告)号:CN114844794B
公开(公告)日:2024-06-04
申请号:CN202210298670.0
申请日:2022-03-25
Applicant: 之江实验室 , 中国科学院计算技术研究所
IPC: H04L43/045 , H04L67/55 , H04L67/565 , H04L67/568 , G06F9/455
Abstract: 本发明提供了一种面向容器的资源监控方法及系统。该方法包括:部署数据采集模块到目标容器中;所述数据采集模块实时采集所述目标容器的CPU、内存、网络数据,并以推送方式上报采集的监控数据至推送代理网关缓存;拉取代理网关定时调用对应接口主动拉取容器和应用监控数据并缓存所述监控数据;监控管理中心拉取所述推送代理网关和所述拉取代理网关两个组件的监控数据并存储到数据库;数据展示模块根据条件获取所述监控管理中心内的监控数据进行可视化展示。同时,根据本发明的上述的一种基面向容器的资源监控方法提供了一种面向容器的资源监控系统。
-
公开(公告)号:CN116451779A
公开(公告)日:2023-07-18
申请号:CN202310249244.2
申请日:2023-03-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向边缘设备的深度学习编程框架评估优化方法,包括:解析深度学习任务的配置文件,获得深度学习任务的程序控制信息;依据该程序控制信息,依次获取边缘设备执行该深度学习任务的多个实际运行数据;该实际运行数据包括该边缘设备运行该深度学习任务时的GPU实际峰值浮点运算数据、GPU实际各层级内存峰值带宽数据、浮点运算数量、GPU内核活动时间和GPU数据移动量;以该实际运行数据绘制该边缘设备运行该深度学习任务的运行时分层屋顶线图;根据该运行时分层屋顶线图,确定对该深度学习任务的优化方向及优化顺序。本发明还提出一种面向边缘设备的深度学习编程框架评估优化系统,以及一种用于深度学习编程框架评估优化的数据处理装置。
-
公开(公告)号:CN107247974A
公开(公告)日:2017-10-13
申请号:CN201710525603.7
申请日:2017-06-30
Applicant: 中国科学院计算技术研究所
CPC classification number: G06K9/6215 , G06K9/6289 , H04B5/0031
Abstract: 本发明涉及一种基于多源数据融合的健身运动识别系统,包括运动数据处理装置和可穿戴设备,其中,所述运动数据处理装置包括用于采集健身器械上的运动数据的采集模块、用于收集所述可穿戴设备上的运动数据的收集模块以及分析所述健身器械上的运动数据与所述可穿戴设备上的运动数据之间的关联性的分析模块。
-
公开(公告)号:CN118606050A
公开(公告)日:2024-09-06
申请号:CN202410762007.0
申请日:2024-06-13
Applicant: 中国科学院计算技术研究所
IPC: G06F9/50
Abstract: 本发明提出一种端边云协同的分布式应用运行时系统,系统物端、边缘、云端均至少配置有:资源代理;执行器资源池,包含至少一执行器,该至少一执行器配置有对应的资源代理,并与该资源代理交互;该至少一执行器在运行时产生计算任务;该资源代理接收到一计算任务卸载请求后,将对应的计算任务执行调度迁移。该系统能够主动适配应用资源需求的实时变化,提高了计算平台性能与服务质量的稳定性。
-
公开(公告)号:CN116501612A
公开(公告)日:2023-07-28
申请号:CN202310330788.1
申请日:2023-03-30
Applicant: 中国科学院计算技术研究所
IPC: G06F11/36
Abstract: 本发明提出一种面向智能网联车场景的边缘计算系统性能测试方法、装置,所述方法包括:获取智能网联车计算基准负载,每一个所述计算基准负载包含多个边缘计算单元;从若干边缘计算单元中提取计算基准负载的多个关键计算单元,构成关键算子集合,所述关键算子集合内一个或多个关键计算单元的组合用于描述智能网联车工作负载;基于所述关键算子集合构建待评测边缘计算系统的性能模型;将所述性能模型送入目标平台进行执行,得到执行性能的预测。该方法实现了多种异构平台下,边缘设备上负载的精准适配及性能预测。
-
公开(公告)号:CN110705684A
公开(公告)日:2020-01-17
申请号:CN201910777631.7
申请日:2019-08-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于端云协同的环境自适应学习方法及系统,包括:步骤1、物端采集环境数据,并使用该物端的本地识别模型判断能否分析该环境数据,若能,则得到并输出该环境数据的识别结果,否则执行步骤2;步骤2、将该环境数据上传至云端,使用云端高精度模型对该环境数据进行识别,根据识别结果选择特定环境的物体识别模型,通过使用该识别结果和该特定物体识别模型的原始训练数据,辅助该本地识别模型进行自适应学习,以更新该本地识别模型,得到更新模型,替换该物端的本地识别模型,再次执行该步骤1。本发明实现了云端模型的自适应学习,通过端云协同的方式,降低模型在物端运行的资源消耗,提高模型对特定计算环境的识别精度和适应能力。
-
公开(公告)号:CN120010996A
公开(公告)日:2025-05-16
申请号:CN202510093772.2
申请日:2025-01-21
Applicant: 中国科学院计算技术研究所
IPC: G06F9/455
Abstract: 本申请公开了一种组件化容器构建系统,系统包括:外部软件源模块、容器组件源模块、开发机模块及执行机模块,开发机模块读取应用程序,分析应用程序依赖的软件,确认容器组件信息,生成依赖软件列表,并将应用程序和依赖软件列表打包为任务闭包;执行机模块读取任务闭包中的依赖软件列表,获取满足依赖软件需求的容器组件信息,并选取要使用的容器组件,使用联合文件系统将容器组件与任务闭包中的应用程序合并为一个根文件系统,根据容器组件和任务闭包中的配置信息生成一个容器运行时的配置文件,并从根文件系统启动容器实例。本发明提出的组件化构建容器的方法具有体积小、构建快、跨平台、高共享的优点。
-
公开(公告)号:CN118708290A
公开(公告)日:2024-09-27
申请号:CN202410762002.8
申请日:2024-06-13
Applicant: 中国科学院计算技术研究所
IPC: G06F9/455 , G06F16/13 , G06F16/174 , G06F16/11
Abstract: 本发明提出一种容器资源占用开销优化方法、系统、介质、计算机设备,该方法包含:记录每一容器对应的函数进程执行时访问到的文件,生成每一容器的文件工作集;对单个容器仅保留文件工作集内的文件而删除其他文件,对多个容器识别出不同文件工作集之间的重复文件以进行去重处理;对每一容器生成快照文件并暂停该容器的运行,识别出每一快照文件中的重复内存页面以进行去重处理;当需要启动新容器时,从快照文件中恢复出容器。该方法提高了同一个服务器上容器之间资源的共享程度和共享效率,实现了减小容器资源开销和加速容器启动速度的效果。
-
公开(公告)号:CN114327926A
公开(公告)日:2022-04-12
申请号:CN202111342715.1
申请日:2021-11-12
Applicant: 中国科学院计算技术研究所
IPC: G06F9/54 , G06F9/50 , G06F15/173
Abstract: 本发明提出一种异构边缘智能微服务器,包括:多个同构或异构的计算单元,各计算单元具有独立的操作系统,并安装有分布式资源管理软件,所有该计算单元接入通用互连总线进行通信连接;异构子计算模块,每个该异构子计算模块包括至少一个该计算单元,该异构子计算模块独立承担或与其他异构子计算模块协作承担边缘计算任务;上级计算模块,包括多个该异构子计算模块。还提出一种异构边缘智能微服务器的搭建方法。
-
-
-
-
-
-
-
-
-