-
公开(公告)号:CN113836386B
公开(公告)日:2022-03-25
申请号:CN202111410689.1
申请日:2021-11-25
Applicant: 之江实验室
IPC: G06F16/953 , G06F21/64 , H04L9/32
Abstract: 本发明提供了一种并行模式搜索空间构造系统和方法,该方法为:初始化输入逻辑张量;计算并输出逻辑张量真值;构造所有候选并行模式,确定输入和输出张量并行模式迭代内容;结合输入张量并行模式迭代内容,切分输入逻辑张量为物理张量;判断物理张量计算合法性,若合法,计算物理张量结果并输出;若非法,继续输入张量并行模式迭代过程;结合输出张量并行模式迭代内容,合并物理张量运算结果为逻辑张量;对比逻辑张量真值和逻辑张量,若相等,将该并行模式添加到合法并行模式搜索空间中,并直接继续输入张量并行模式迭代过程;若不相等,继续输出张量并行模式迭代过程,直到迭代完成后,重复所述以上步骤,直到所述输入张量并行模式迭代过程完成。
-
公开(公告)号:CN114119426A
公开(公告)日:2022-03-01
申请号:CN202210090686.2
申请日:2022-01-26
IPC: G06T5/00
Abstract: 本发明公开了非局部低秩转换域与全连接张量分解图像重构方法及装置,包括:S1,输入待修复图像;S2,构建张量分解模型,包括:S2.1,分割输入图像,得到非局部张量块;S2.2,将非局部张量块引入B样条转换域,得到非局部张量块的转换域形式;S2.3,通过非局部张量块,构造非局部相似张量块组;S2.4,联合全连接张量分解,构造全连接张量分解因子;S2.5,构建低秩张量补全模型,并根据S2.1‑2.4进行优化,得到基于非局部低秩转换域与全连接张量分解模型;S3,构建图像修复模型,获取待修复图像,通过张量分解模型得到的修复图像张量块组,得到修复后的图像。使得在光谱图像修复中,整图像重构更加精准。
-
公开(公告)号:CN113835695B
公开(公告)日:2022-02-18
申请号:CN202111408005.4
申请日:2021-11-25
Applicant: 之江实验室
Abstract: 本发明公开了一种基于统一后端引擎的深度学习框架与硬件设备适配方法,包括如下步骤:S1:深度学习框架添加统一后端引擎;S2:硬件设备添加统一后端引擎;S3:转换计算图,将深度学习框架编译生成的计算图转换为统一后端引擎的中间表示;S4:编译中间表示,统一后端引擎在硬件设备上编译中间表示生成可执行对象;S5:运行可执行对象,深度学习框架在硬件设备上运行可执行对象;S6:统一后端引擎的内存管理。本发明打通了深度学习框架与硬件设备,将深度学习框架源码与芯片底层软件全面对接,尽可能最大限度地释放芯片的硬件能力,为端侧AI提供强劲算力。
-
公开(公告)号:CN113835695A
公开(公告)日:2021-12-24
申请号:CN202111408005.4
申请日:2021-11-25
Applicant: 之江实验室
Abstract: 本发明公开了一种基于统一后端引擎的深度学习框架与硬件设备适配方法,包括如下步骤:S1:深度学习框架添加统一后端引擎;S2:硬件设备添加统一后端引擎;S3:转换计算图,将深度学习框架编译生成的计算图转换为统一后端引擎的中间表示;S4:编译中间表示,统一后端引擎在硬件设备上编译中间表示生成可执行对象;S5:运行可执行对象,深度学习框架在硬件设备上运行可执行对象;S6:统一后端引擎的内存管理。本发明打通了深度学习框架与硬件设备,将深度学习框架源码与芯片底层软件全面对接,尽可能最大限度地释放芯片的硬件能力,为端侧AI提供强劲算力。
-
公开(公告)号:CN113420865A
公开(公告)日:2021-09-21
申请号:CN202110660174.0
申请日:2021-06-15
Applicant: 之江实验室
Abstract: 本发明涉及一种基于多算子融合的深度神经网络推理加速方法和系统,该方法具体为:首先输入神经网络计算图,获取神经网络计算逻辑图,依据神经网络算子间计算关系,获取完整的神经网络前向计算的符号表达式;然后使用可融合算子搜索方法,利用算子符号表达式自动简化系统,化简神经网络前向计算的符号表达式,获取最简的符号表达式,实现多算子融合;再依据多算子融合结果,根据获得的最简符号表达式,构建新的神经网络计算推理逻辑图,解耦最简符号表达式,离线计算并存储为新的模型参数,构建相应的神经网络模型结构;最后加载新的模型参数实现推理加速。本发明能够减少算子执行间隙的开销,提升设备计算资源利用率,优化网络整体推理速度。
-
公开(公告)号:CN113191385A
公开(公告)日:2021-07-30
申请号:CN202110318366.3
申请日:2021-03-25
Applicant: 之江实验室
Abstract: 本发明公开了一种基于预训练标注数据不可知的图像分类自动标注方法,包括如下步骤:S1,获取待标注图像,收集预训练图像分类模型;S2,将预训练图像分类模型拆分成特征提取模型与标签预测模型,并初始化,固定标签预测模型参数,不参与后续迁移训练;S3,约束特征提取模型,使自动标注模型的输出具体类别确定,整体分布离散;S4,对特征提取模型输出特征进行聚类;S5,筛选出大小超过阈值的聚类簇,所对应的类别组成为待标注图像标签空间;S6,给所有待标注图像打上伪标签;S7,重新聚类并分配伪标签,对特征提取模型进行有监督训练;S8,迭代S3至S7;S9,使用迁移后的自动标注模型对待标注图像进行推理,得到标注结果。
-
公开(公告)号:CN120086097A
公开(公告)日:2025-06-03
申请号:CN202510571851.X
申请日:2025-05-06
Applicant: 之江实验室
Abstract: 本申请提供一种异构集群的大模型训练的监控方法以及电子设备。异构集群的大模型训练的监控方法包括:获取大模型在异构集群中处于启动状态的每台设备上的当次训练数据;根据当次训练数据,确定用于表征训练进程的当次性能数据;若当次性能数据未处于正常范围内,根据上次训练过程中的历史性能数据和当次性能数据,确定故障信息;根据故障信息,确定大模型训练是否发生异常,以监控大模型的训练过程。本申请可以监控大模型训练的训练过程,及时发现故障等异常情况。
-
公开(公告)号:CN116821778B
公开(公告)日:2024-01-09
申请号:CN202311103044.2
申请日:2023-08-30
Applicant: 之江实验室
IPC: G06F18/24 , A61B5/11 , G06N3/0464 , G06N3/0442 , G06N3/084
Abstract: 本申请涉及一种基于WIFI信号的步态识别方法、装置和可读存储介质,其中,基于WIFI信号的步态识别方法包括:通过利用不同环境下采集的训练样本对所述步态特征提取器、环境判别器以及步态识别器进行训练,以使得所述特征提取器提取的所述人体步态特征包含人体步态信息的同时不包含环境信息作为目的,得到训练完成的步态识别模型,通过将所述第一时频图输入至训练完成的步态识别模型,输出所述待测对象所对应的身份信息。解决了相关技术中步态识别模型对环境变化敏感的问题,实现了步态识别模型
-
公开(公告)号:CN117093871A
公开(公告)日:2023-11-21
申请号:CN202311335992.9
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F18/214 , G06F18/20 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种面向深度学习分布式训练测评方法和系统,其中,面向深度学习分布式训练测评方法包括:对各所述分布式神经网络模型分别进行训练,获得对应的第一性能指标;并基于各所述第一性能指标,调整各所述分布式神经网络模型的所述分布式优化算法、所述分布式策略并行度以及所述训练参数,以进行优化训练,得到对应的第二性能指标;基于各所述第二性能指标,确定最优分布式神经网络模型。本发明使用指标量化评估各分布式神经网络模型计算的性能,并基于评估指标进一步进行优化训练,提高了各分布式神经网络模型计算的性能,通过优化后的指标,获得最优分布式神经网络模型,帮助技术人员高效部署分布式神经网络模型。
-
公开(公告)号:CN117032739A
公开(公告)日:2023-11-10
申请号:CN202311285993.7
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 本说明书公开了一种镜像生成的方法、系统、存储介质及电子设备,包括:确定用户选择的生成目标镜像文件所需的基础镜像的环境信息,并展示给用户。再确定基于基础镜像生成目标镜像文件时所需的其他资源的资源信息,并根据资源信息,从资源库中确定生成目标镜像文件时所需的材料文件。根据环境信息和资源信息,采用指定规则,生成目标镜像文件对应的指令文件。根据材料文件及基础镜像,按照指令文件中的指令,自动完成目标镜像的构建。所述系统和方法使得用户无需掌握复杂的镜像构建语法,降低目标镜像构建的技术门槛,并能快速生成符合要求的目标镜像,提高了镜像构建的效率。
-
-
-
-
-
-
-
-
-