-
公开(公告)号:CN112232511A
公开(公告)日:2021-01-15
申请号:CN202011470331.3
申请日:2020-12-15
Applicant: 之江实验室
Abstract: 本发明公开了一种面向多任务的预训练语言模型自动压缩方法及平台。该方法设计一种结构生成器的元网络,基于Transformer层采样的知识蒸馏方法构建知识蒸馏编码向量,利用结构生成器生成与当前输入的编码向量对应的蒸馏结构模型;同时提出伯努利分布采样的方法训练结构生成器;每轮迭代时,利用伯努利分布采样的方式迁移各个编码器单元,组成对应的编码向量;通过改变输入结构生成器的编码向量和小批次的训练数据,联合训练结构生成器和对应的蒸馏结构,可以学得能够为不同蒸馏结构生成权重的结构生成器;同时在已训练好的元学习网络基础上,通过进化算法搜索最优压缩结构,由此得到与任务无关的预训练语言模型的最优通用压缩架构。
-
公开(公告)号:CN119377076A
公开(公告)日:2025-01-28
申请号:CN202411941286.3
申请日:2024-12-26
Applicant: 之江实验室
IPC: G06F11/34
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质以及电子设备,具体包括:针对每个目标芯片,根据芯片信息和目标模型的模型数据,对该目标芯片执行模型训练任务时的参数进行参数配置。通过配置后的该目标芯片执行模型训练任务,收集模型训练日志数据,确定该目标芯片的性能评估值。根据各目标芯片的性能评估值确定适配目标芯片,通过适配目标芯片执行目标任务。通过此方法可以有效提高针对异构芯片的性能评估效率,并且本说明书对各异构芯片的评测方式更加精准且一致,使得各异构芯片之间的性能差距更为直观,提高最佳适配芯片确定效率的同时,为对芯片进行性能优化,还是为模型训练选择更加适合的应用芯片都提供了更为实用的理论依据和帮助。
-
公开(公告)号:CN117573359A
公开(公告)日:2024-02-20
申请号:CN202311604252.0
申请日:2023-11-28
Applicant: 之江实验室
IPC: G06F9/50
Abstract: 本说明书提供的一种基于异构集群的计算框架管理系统及方法,客户端向用户展示可供用户选择不同计算框架的第一页面,并响应于用户的选择操作,确定出目标框架以及目标计算任务,并生成资源请求,以发送至服务器。服务器接收资源请求并从预设的数据库中查询出目标集群资源信息,并根据目标集群资源信息,生成调度请求,进而确定出调度请求对应的目标计算节点,并向目标计算节点发送执行指令,以使目标计算节点释放相应的资源,以执行计算任务。
-
公开(公告)号:CN117555644A
公开(公告)日:2024-02-13
申请号:CN202410043653.1
申请日:2024-01-11
Applicant: 之江实验室
IPC: G06F9/451 , G06F16/332 , G06F40/279 , G06F18/214 , G06F9/445
Abstract: 本说明书公开了一种基于自然语言交互的前端页面构建方法及装置,响应于创建的对话流程,将目标文本和第一指令信息,输入训练完成的语言模型,确定目标文本包含的组件实体和该组件实体的嵌入向量。将嵌入向量和标准向量进行匹配,确定匹配向量,以及匹配向量对应的组件用途和组件代码,根据该组件用途、该组件代码和目标文本,生成第二指令信息,将第二指令信息,输入语言模型,确定页面代码,根据页面代码,构建前端页面。这样,在构建前端页面时,通过人机对话的方式,输入包含前端页面构建的需求的文本,明确对构成前端页面的组件实体的操作,即可得到满足构建需求的前端页面,不需再重复编写各组件的代码,提高了软件开发的效率。
-
公开(公告)号:CN117075930B
公开(公告)日:2024-01-26
申请号:CN202311344160.3
申请日:2023-10-17
Applicant: 之江实验室
Abstract: 本说明书公开了一种计算框架管理系统。所述计算框架管理系统包括:计算框架安装模块、计算框架管理模块、交互模块、调度模块,可以根据用户的需求为用户提供用户所需的交互方式与用户进行交互,使得用户不需要学习与计算框架及其依赖的计算集群的使用方式,仅通过计算框架管理系统对不同的计算框架进行安装、配置以及使用,并可以通过计算框架管理系统自动监控计算集群和计算任务的执行状态,并自动处置存在异常的计算任务,进而可以在提升用户的体验同时,有效地在异构计算集群上对计算框架进行管理。
-
公开(公告)号:CN117037913A
公开(公告)日:2023-11-10
申请号:CN202311285979.7
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 本说明书公开了一种蛋白质多序列比对方法、装置、存储介质及电子设备。所述蛋白质多序列比对方法包括:获取待比对蛋白质序列的特征表示,并将待比对蛋白质序列的特征表示拆分为指定数量的子特征表示,针对每个子特征表示,确定该子特征表示和预先确定的各聚类中心特征表示中与该子特征表示相对应的每个各聚类中心特征表示之间的相似度,并根据相似度确定每个子特征表示对应的目标聚类中心,从各基础蛋白质序列中确定出与目标聚类中心相匹配的各基础蛋白质序列,作为各候选蛋白质序列,将待比对蛋白质序列与每个候选蛋白质序列进行比对,得到与待比对蛋白质相匹配的目标蛋白质序列,并根据待比对蛋白质和目标蛋白质序列进行任务执行。
-
公开(公告)号:CN116821778A
公开(公告)日:2023-09-29
申请号:CN202311103044.2
申请日:2023-08-30
Applicant: 之江实验室
IPC: G06F18/24 , A61B5/11 , G06N3/0464 , G06N3/0442 , G06N3/084
Abstract: 本申请涉及一种基于WIFI信号的步态识别方法、装置和可读存储介质,其中,基于WIFI信号的步态识别方法包括:通过利用不同环境下采集的训练样本对所述步态特征提取器、环境判别器以及步态识别器进行训练,以使得所述特征提取器提取的所述人体步态特征包含人体步态信息的同时不包含环境信息作为目的,得到训练完成的步态识别模型,通过将所述第一时频图输入至训练完成的步态识别模型,输出所述待测对象所对应的身份信息。解决了相关技术中步态识别模型对环境变化敏感的问题,实现了步态识别模型的跨环境应用。
-
公开(公告)号:CN116153389B
公开(公告)日:2023-07-18
申请号:CN202310431440.1
申请日:2023-04-21
Applicant: 之江实验室
Abstract: 本申请涉及人工智能领域,特别是涉及一种蛋白质语言模型的量化方法、装置、设备和存储介质,所述方法包括:采用均匀对称量化方法对蛋白质语言模型的权重值进行量化;通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围,并将所述第一截断范围划分为多个量化区间;通过分段线性量化方法分别对所述多个量化区间的激活值进行量化;基于量化后的权重值以及量化后的激活值,配置得到量化后的蛋白质语言模型。本发明提出的量化方法降低了模型量化的精度损失,在保证量化后模型预测精度的同时,减少模型的内存占用,提升模型推理速度。
-
公开(公告)号:CN116384446A
公开(公告)日:2023-07-04
申请号:CN202310235078.0
申请日:2023-03-06
Applicant: 之江实验室
IPC: G06N3/0464 , G06N3/092 , G06N3/086
Abstract: 一种基于变异器的神经网络架构搜索方法。包括:用户定义超级网络搜索空间,实例化超级网络;获取实例化超级网络的搜索策略的分支选择,使用突变器保存策略选择结果;利用突变器对超级网络算法的逻辑计算图进行转换;训练超级网络,并根据反馈信息调整搜索策略。本发明利用变异器抽象和控制流优化,实现计算加速和显存占用优化。该技术通过分析和优化现有网络计算图逻辑,对原有计算逻辑进行优化,以减少冗余算子执行开销并且提升设备显存资源利用率,从而实现多网络整体推理训练的优化。
-
公开(公告)号:CN116151355A
公开(公告)日:2023-05-23
申请号:CN202310422202.4
申请日:2023-04-19
Applicant: 之江实验室
IPC: G06N3/08 , G06N3/0455 , G06N3/0442 , G06F40/295
Abstract: 本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。所述模型训练和业务执行的方法包括:将样本语句输入待训练业务模型,确定样本语句对应的初始语义特征,并对初始语义特征进行处理,基于第一膨胀系数和第二膨胀系数对所述处理后特征进行卷积处理,得到中间特征,基于第三膨胀系数和第四膨胀系数对所述中间特征进行卷积处理,得到目标特征,根据目标特征,确定头尾指针矩阵以及字间关系矩阵,根据头尾指针矩阵以及字间关系矩阵,确定目标特征矩阵,基于目标特征矩阵,识别样本语句中包含的实体对象,以最小化识别出的实体对象与样本语句中实际包含的实体对象之间的偏差为优化目标,对业务模型进行训练。
-
-
-
-
-
-
-
-
-