-
公开(公告)号:CN116048542B
公开(公告)日:2023-10-31
申请号:CN202310098795.3
申请日:2023-02-11
Applicant: 之江实验室
Abstract: 本发明公开了一种计算机视觉深度学习模型的优化部署方法与装置,所述方法和装置核心为模型优化服务和模型部署服务两个模块。模型优化服务模块可将训练好的模型通过IR中间表示)转换为适配目标推理引擎及硬件设备的框架格式,提升推理性能。模型部署服务模块支持本地部署和在线部署两种方式,其中本地部署是指将待部署模型文件封装为SDK,下载至本地设备进行端侧推理;在线部署是指将待部署模型文件在云端服务器部署,开放接口供用户调用推理服务,本发明通过构建完整的模型优化和部署服务流程与装置,降低深度学习模型部署的复杂度,对多种模型网络架构、推理引擎的扩充兼容,使本公开实施例更具灵活性和可拓展性。
-
公开(公告)号:CN115250246A
公开(公告)日:2022-10-28
申请号:CN202211148618.3
申请日:2022-09-21
Applicant: 之江实验室
IPC: H04L43/10 , H04L67/10 , H04L67/50 , H04L69/164 , H04L69/22
Abstract: 本发明公开了一种监测虚拟机集群中节点状态的方法和计算机系统。该方法基于通用的主/从分布式集群架构,自定义面向通信协议透明的心跳包编码及解码规则;基于全局可分发的编码元数据,设计了分段标识以及前缀匹配的身份标识编码格式,突破数据包所有字段都以字节为最小单位的编码范式,构造相对轻量级的心跳数据包。该方法应用在大规模集群中,能够有效减少监测数据所占用的系统带宽资源,提升虚拟机集群的网络吞吐量和稳定性。
-
公开(公告)号:CN115248734A
公开(公告)日:2022-10-28
申请号:CN202211148614.5
申请日:2022-09-21
Applicant: 之江实验室
IPC: G06F9/50
Abstract: 本发明公开了一种私有云多租户的资源配额自适应调节方法及装置。该装置主要包含资源使用率监控模块和资源配额管控模块,其中资源配额管控模块用于自适应调节资源配额,基于定时任务周期化地执行调节流程。该方法通过资源使用率监控数据计算各租户在上一周期内资源实际使用率结果,并基于预设的预期使用率调节阈值,对资源配额不合理的租户进行资源配额调节,相较于集群管理平台提供的资源配额设置功能,该方法能适应于租户群体规模、使用习惯、时间等因素的动态变化,避免不必要的集群扩容,轻量级地有效提升集群资源使用率。
-
公开(公告)号:CN118397435A
公开(公告)日:2024-07-26
申请号:CN202410839719.8
申请日:2024-06-26
Applicant: 之江实验室
Abstract: 本说明书公开了基于图像识别模型的任务执行方法、装置、介质及设备,终端设备将样本图像输入到初始图像识别模型中,得到样本图像对应的表征感兴趣区域的类别激活映射图,而后通过初始图像识别模型中包含的各网络层对应的亲和矩阵对类别激活映射图进行补偿,进而确定样本图像中各像素点对应的相关性权重矩阵,从而确定出样本图像中各像素点对对应的相关性标签,根据各像素点对对应的相关性标签,调整各网络层对应的亲和矩阵,并通过调整后的图像识别模型执行任务。通过增强了调整后图像识别模型中亲和矩阵对于类别激活映射图的补偿程度,使得调整后的图像识别模型在执行任务过程中具备更强的识别精度,提高了图像识别任务的执行效率。
-
公开(公告)号:CN116935055B
公开(公告)日:2024-01-09
申请号:CN202311202665.6
申请日:2023-09-18
Applicant: 之江实验室
IPC: G06V10/26 , G06V10/25 , G06V10/764 , G06N3/0895
Abstract: 本说明书公开了一种基于注意力掩码的弱监督语义分割方法及装置,可以将样本图像输入到注意力编码器中,得到全局类别令牌特征、图像分类结果和两种语义分割结果,而后,将该样本图像再次输入到注意力编码器中,生成样本图像对应的注意力矩阵以及随机生成目标掩码矩阵,并通过目标掩码矩阵对注意力矩阵进行补偿,得到补偿后的注意力矩阵,根据补偿后的注意力矩阵,生成各局部类别令牌特征,将各局部类别令牌特征区分正负性。模型损失不仅包含图像分类、图像语义分割的损失、还包括通过将各局部类别令牌特征区分正负性与全局类别令牌特征一起进行对比学习的损失,通过引入了多种损失对模型的语义分割进行监督,从而提高了语义分割的准确性。
-
公开(公告)号:CN116935055A
公开(公告)日:2023-10-24
申请号:CN202311202665.6
申请日:2023-09-18
Applicant: 之江实验室
IPC: G06V10/26 , G06V10/25 , G06V10/764 , G06N3/0895
Abstract: 本说明书公开了一种基于注意力掩码的弱监督语义分割方法及装置,可以将样本图像输入到注意力编码器中,得到全局类别令牌特征、图像分类结果和两种语义分割结果,而后,将该样本图像再次输入到注意力编码器中,生成样本图像对应的注意力矩阵以及随机生成目标掩码矩阵,并通过目标掩码矩阵对注意力矩阵进行补偿,得到补偿后的注意力矩阵,根据补偿后的注意力矩阵,生成各局部类别令牌特征,将各局部类别令牌特征区分正负性。模型损失不仅包含图像分类、图像语义分割的损失、还包括通过将各局部类别令牌特征区分正负性与全局类别令牌特征一起进行对比学习的损失,通过引入了多种损失对模型的语义分割进行监督,从而提高了语义分割的准确性。
-
公开(公告)号:CN115248734B
公开(公告)日:2022-12-13
申请号:CN202211148614.5
申请日:2022-09-21
Applicant: 之江实验室
IPC: G06F9/50
Abstract: 本发明公开了一种私有云多租户的资源配额自适应调节方法及装置。该装置主要包含资源使用率监控模块和资源配额管控模块,其中资源配额管控模块用于自适应调节资源配额,基于定时任务周期化地执行调节流程。该方法通过资源使用率监控数据计算各租户在上一周期内资源实际使用率结果,并基于预设的预期使用率调节阈值,对资源配额不合理的租户进行资源配额调节,相较于集群管理平台提供的资源配额设置功能,该方法能适应于租户群体规模、使用习惯、时间等因素的动态变化,避免不必要的集群扩容,轻量级地有效提升集群资源使用率。
-
公开(公告)号:CN115250246B
公开(公告)日:2022-12-06
申请号:CN202211148618.3
申请日:2022-09-21
Applicant: 之江实验室
IPC: H04L43/10 , H04L67/10 , H04L67/50 , H04L69/164 , H04L69/22
Abstract: 本发明公开了一种监测虚拟机集群中节点状态的方法和计算机系统。该方法基于通用的主/从分布式集群架构,自定义面向通信协议透明的心跳包编码及解码规则;基于全局可分发的编码元数据,设计了分段标识以及前缀匹配的身份标识编码格式,突破数据包所有字段都以字节为最小单位的编码范式,构造相对轻量级的心跳数据包。该方法应用在大规模集群中,能够有效减少监测数据所占用的系统带宽资源,提升虚拟机集群的网络吞吐量和稳定性。
-
公开(公告)号:CN115242882A
公开(公告)日:2022-10-25
申请号:CN202211140330.1
申请日:2022-09-20
Applicant: 之江实验室
IPC: H04L67/63 , H04L61/4511 , H04L67/56 , H04L67/141 , H04L9/40
Abstract: 本发明公开了一种基于传输层路由访问k8s容器环境的方法及装置,应用于容器云平台,获取客户端的基于域名和固定端口的连接请求;通过域名解析服务器,将连接请求解析并根据固定端口,转发到相应的代理服务器上;代理服务器根据预设的域名和容器集群目标节点的映射关系,将连接请求转发到目标节点;根据预设的认证方式,建立网络连接。本发明实现多租户的传输层路由,为开发人员提供基于安全外壳协议的容器环境访问方式,本发明只对外暴露预先设定的代理服务器的固定端口,避免了kubernetes集群中容器组IP或Service端口的外泄,有效提升了容器云平台的安全性。
-
公开(公告)号:CN114741207B
公开(公告)日:2022-09-30
申请号:CN202210649280.3
申请日:2022-06-10
Applicant: 之江实验室
Abstract: 本发明公开一种基于多维度组合并行的GPU资源调度方法和系统,该方法包括:步骤一,在GPU资源管理中心添加GPU资源插件模块;步骤二,运行插件模块,完成数据层和物理层各类型GPU资源对应的联动;步骤三,GPU资源管理中心从GPU异构集群收集GPU资源的实时基本信息,并下发到GPU资源调度模块;步骤四,调用GPU资源时,向GPU资源调度模块发送支持多维度的组合调度的请求任务;步骤五,GPU资源调度模块将请求任务的主任务转换成可执行的单维度调度子任务并下发至GPU异构集群,GPU异构集群根据子任务按需分配GPU资源。本发明能有效提升GPU资源的利用率。
-
-
-
-
-
-
-
-
-