-
公开(公告)号:CN116992875A
公开(公告)日:2023-11-03
申请号:CN202311263225.1
申请日:2023-09-27
Applicant: 之江实验室
IPC: G06F40/289 , G06F40/30 , G06N20/00
Abstract: 本申请涉及一种文本生成方法、装置、计算机设备和存储介质。所述方法包括:基于关键词数据集训练初始文本生成模型,所述关键词数据集包括参考关键词以及参考文本,将所述参考关键词输入所述初始文本生成模型,得到初始模型生成文本,将所述初始模型生成文本以及初始拼接文本作为关键词中文对比数据集,基于所述关键词中文对比数据集和标准中文对比数据集训练文本生成奖励模型,基于所述初始文本生成模型和文本生成奖励模型确定目标文本生成模型,将候选关键词输入所述目标文本生成模型,得到目标生成文本。不仅保证了关键词一定出现在生成文本中,还提高了生成文本的语义准确性。
-
公开(公告)号:CN116991986A
公开(公告)日:2023-11-03
申请号:CN202311269260.4
申请日:2023-09-28
Applicant: 之江实验室
IPC: G06F16/33 , G06F16/35 , G06F18/214 , G06F18/23213
Abstract: 本申请涉及一种语言模型轻量化方法、装置、计算机设备和存储介质。所述方法包括:对初始语言模型的注意力层的可学习参数进行聚类,得到可学习参数的分区;对各个分区进行组合,得到初始语言模型的所有裁剪方式;基于初始语言模型的注意力层的各个功能在各个裁剪方式下的波动率,得到各个功能的对应分区;剔除或量化与待处理的任务所对应的功能相关性低的可学习参数,得到待训练的语言模型的可学习参数;基于待训练的语言模型的可学习参数,利用梯度下降法对可学习参数进行训练,直到收敛,得到完备的轻量化语言模型。采用本方法能够解决了现有的语言模型无法利用较少的计算资源来实现高精度的任务处理的问题。
-
公开(公告)号:CN116860259A
公开(公告)日:2023-10-10
申请号:CN202311138278.0
申请日:2023-09-05
Applicant: 之江实验室
Abstract: 本说明书公开了一种模型训练和编译器自动调优的方法、装置及设备。所述模型训练的方法包括:获取目标程序,并确定编译器对该目标程序进行编译时的各优化序列;确定出初始优化序列并生成当前样本点,以及,确定初始优化序列对所述目标程序进行编译的第一运行时间;生成邻域样本点,并确定邻域样本点对目标程序进行编译的第二运行时间;判断第一运行时间是否大于第二运行时间,若是,将邻域样本点作为当前样本点;在达到指定迭代次数后,确定运行时间小于预设时间的若干个各候选优化序列,并根据各候选优化序列构建训练样本;通过构建的训练样本对预测模型进行训练。
-
公开(公告)号:CN116779021A
公开(公告)日:2023-09-19
申请号:CN202310329242.4
申请日:2023-03-29
Applicant: 之江实验室
IPC: G16B15/30 , G16B30/00 , G16C20/50 , G06N3/0464 , G06N3/08
Abstract: 一种基于自动特征交叉的药物靶标结合亲和力预测方法,包括:获取药物分子SMILES序列、靶标蛋白氨基酸序列以及固有属性特征;将SMILES序列表示为基于原子和化学键构成的图;分别对药物分子图和氨基酸序列表征学习,获得药物分子的特征嵌入和氨基酸的特征嵌入;对药物分子及靶标蛋白的类别型固有属性特征进行嵌入表征,获得类型型固有属性特征嵌入;使用SENet对前述步骤各类特征嵌入进行相关性建模,动态学习特征重要性;采用自动特征交叉方法对筛选的特征进行特征交叉;基于筛选特征和交叉特征,获得药物分子与靶标蛋白的结合亲和力预测值。本发明能够自适应的学习和融合药物分子和靶标蛋白的特征信息,大大提升了药物分子与靶标蛋白结合亲和力预测的准确度。
-
公开(公告)号:CN116777010A
公开(公告)日:2023-09-19
申请号:CN202311080508.2
申请日:2023-08-25
Applicant: 之江实验室
IPC: G06N20/00
Abstract: 本说明书公开了一种模型训练的方法以及任务执行方法及装置,可以将获取到的在指定空间中混合物态在第一时刻下的各物理场数据输入到预测模型中,来训练该预测模型,这样一来,在将训练后的预测模型应用到实际任务执行的过程中时,相比于现有技术并不需要耗费过多的时间来一步步推导出下一时刻的指定空间中混合物态在第二时刻下的各物理场数据,这样不仅提高了预测物理场数据的效率,而且由于在训练阶段,是以混合物态在第一时刻和第二时刻前后之间的质量分布符合质量约束为条件,对预测模型进行训练,所以可以保证预测模型在实际应用中所预测出的物理场数据的准确性。
-
公开(公告)号:CN116737607A
公开(公告)日:2023-09-12
申请号:CN202311029639.8
申请日:2023-08-16
Applicant: 之江实验室
IPC: G06F12/0875 , G06F12/0888 , G06F12/0895 , G06N3/084 , G06N3/047 , G06N3/048 , G06V10/94 , G06V10/774 , G06V10/82
Abstract: 本申请涉及一种样本数据缓存方法、系统、计算机设备和存储介质。所述方法包括:获取用于训练的样本数据列表;若缓存区域的解码样本数据集中不存在与样本数据列表中第一样本数据匹配的解码样本数据,则从解码样本数据集中确定备选解码样本数据;若第一样本数据的重要度与备选解码样本数据的重要度满足预设条件且第一样本数据的解码资源消耗大于备选解码样本数据的解码资源消耗,则对第一样本数据进行解码处理,得到对应的目标解码样本数据;根据目标解码样本数据对缓存区域的解码样本数据集进行更新。采用本方法减少冗余的IO和考虑了数据解码本身的资源消耗,缩短了整体的训练时长,进而提高了训练效率。
-
公开(公告)号:CN116502679B
公开(公告)日:2023-09-05
申请号:CN202310543696.1
申请日:2023-05-15
Applicant: 之江实验室
IPC: G06N3/0464 , G06N3/063 , G06N3/08
Abstract: 本说明书公开了一种模型构建方法、装置、存储介质及电子设备,可以对需要进行测试的各候选模型架构进行筛选,以筛选出通过代理模型预测出的性能参数的准确率较低的部分候选模型架构,来通过部署测试模型的方式获得该候选模型架构的真实性能参数,而针对剩余的候选模型架构,可以直接通过代理模型来获取出性能参数,并且可以通过主动学习的方法,在线对代理模型进行训练,从而可以在保证候选模型架构的性能评估准确率的同时,提升自动化构建深度学习模型的效率。
-
公开(公告)号:CN116402165B
公开(公告)日:2023-09-01
申请号:CN202310669720.6
申请日:2023-06-07
Applicant: 之江实验室
Abstract: 本说明书公开了一种算子检测的方法、装置、存储介质以及电子设备,本说明书提供的算子检测方法可以获取待检测算子,将校验数据输入到该待检测算子中,得到该待检测算子输出的第一结果,以及将该校验数据输入到确定出的与待检测算子对应的至少一个参考算子中,得到经过至少一个参考算子对校验数据进行数据处理后所得到的第二结果,最后,根据第一结果以及所述第二结果,对待检测算子进行检测,本方法通过确定出和待检测算子功能相符的参考算子,并通过相同的校验数据分别输入到待检测算子和参考算子,从而通过将得出的结果进行对比,可以对待检测算子进行检测,提高了深度学习模型中算子的功能准确性。
-
公开(公告)号:CN116661574A
公开(公告)日:2023-08-29
申请号:CN202310860078.X
申请日:2023-07-13
Applicant: 之江实验室
IPC: G06F1/20 , G06F18/214
Abstract: 本说明书公开了一种计算设备散热的方法、装置、存储介质及电子设备,本方法通过确定各时刻的计算设备的芯片的特征以及计算设备的散热单元中冷却介质的特征确定训练样本,并获取散热单元的控制指令作为训练样本的标注,然后针对每个特征维度,根据该维度的特征对训练样本进行排序以确定该维度的样本序列,再确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组作为目标样本组,根据各目标样本组以及各目标样本组对应的标注确定控制规则,进一步对计算设备进行散热控制。本方法通过对历史上控制指令、芯片特征以及散热单元中冷却介质的特征的学习生成控制规则,使计算设备可以自行进行散热控制。
-
公开(公告)号:CN116301904B
公开(公告)日:2023-08-22
申请号:CN202310559970.4
申请日:2023-05-18
Applicant: 之江实验室
IPC: G06F8/41 , G06N3/006 , G06N3/0475 , G06N3/08
Abstract: 本发明公开了一种用于深度学习编译器的算子优化加速方法及装置,目的是减少算子优化空间的搜索时间。该方法首先将神经网络抽象成计算图的形式,再对计算图进行图优化,并为优化后的计算图中的每个算子定义优化空间。然后以LightGBM为代价模型,粒子群优化算法为搜索算法对优化空间进行搜索。在每轮搜索中,对搜索算法输出的候选解采用DBSCAN进行聚类和采样,减少在硬件上的实测次数,进一步提升搜索效率。
-
-
-
-
-
-
-
-
-