-
公开(公告)号:CN116562218B
公开(公告)日:2024-02-20
申请号:CN202310493297.9
申请日:2023-05-05
Applicant: 之江实验室
IPC: G06F30/392 , G06F17/16 , G06N3/0464 , G06N3/092
Abstract: 一种基于强化学习实现矩形宏单元的布图规划方法,包含:根据公开数据集ispd2005整理宏单元和标准单元信息;用GCN对宏单元编码;将宏单元按照面积从大到小排序,将排好顺序的宏单元信息和宏单元编码作为双线性模型的输入,提取环境特征;根据宏单元大小计算掩模矩阵确定当前宏单元可摆放的范围;将环境特征作为强化学习策略网络的输入,策略网络输出宏单元摆放位置的概率;根据策略网络的输出和掩模矩阵确定宏单元的位置;奖励函数设为总线长、拥塞程度和布局密度的加权和。还包括一种基于强化学习实现矩形宏单元的布图规划系统。本发明在满足宏单元互相不相交的约束条件下,为用强化学习求解不同大小的矩形宏单元的布图规划问题提供了一种解决方案。
-
公开(公告)号:CN117522669A
公开(公告)日:2024-02-06
申请号:CN202410025766.9
申请日:2024-01-08
Applicant: 之江实验室
Abstract: 本说明书公开了一种图形处理器内存优化方法、装置、介质及设备,确定处理系统当前训练的各神经网络模型。针对每个图形处理器,确定当前执行的网络层输出的各张量以及各张量的张量信息。将张量信息中的生命周期未达到预设阈值的各张量,作为短时张量。针对每个短时张量,根据该短时张量的张量信息中的调用路径,判断神经网络模型的下一网络层是否需要调用该短时张量。若是,则将该短时张量存储该图形处理器的存储器中。若否,则将该短时张量发送至空闲的图形处理器中。通过将短时张量发送至空闲的图形处理器,避免了将图形处理器的短时张量存储到其他非图形处理器的存储器的问题,降低了通信开销,提高了模型训练的性能。
-
公开(公告)号:CN117032936B
公开(公告)日:2024-02-06
申请号:CN202311267177.3
申请日:2023-09-28
Applicant: 之江实验室
IPC: G06F9/48 , G06F9/50 , G06F18/214 , G06N3/006
Abstract: 本申请涉及一种数据调度方法、装置和计算机设备。所述方法包括:对TPU上的数据进行分块,将加载时间和卸载时间均相同的数据划分为同一数据块;基于数据块所对应的加载时间和卸载时间,得到数据调度模型的初始参数;基于每块TPU存储量的大小,得到数据块占用TPU数量的时间分布;根据数据块占用TPU数量的时间分布,计算资源消耗量;利用粒子群优化算法,对初始数据调度模型的参数进行优化训练,直至按照训练后的数据调度模型进行数据调度的资源消耗量,达到按照预设的最少的TPU数量计算得到的资源消耗量时,停止训练,得到完备数据调度模型;基于完备数据调度模型,对TPU上的数据块进行数据调度。采用本方法能够解决计算机的计算
-
公开(公告)号:CN117009092B
公开(公告)日:2024-02-02
申请号:CN202311278281.2
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 基于多重多臂老虎机的编译时间资源动态分配方法及系统,其方法包括:步骤1,获取待编译的深度学习模型,对模型进行计算图级别优化,并进行图切分;步骤2,分配深度学习模型整体编译时间,并对时间资源进行分块;步骤3,遍历多个计算子图或算子,对当前某个计算子图或算子采集其历史编译特征信息;步骤4,设置分配决策模型参数进行训练或更新,并对当前计算子图或算子的潜力进行预测;步骤5,采用强化学习技术选择当前最具潜力的计算子图或算子;步骤6,为最具优化潜力的计算子图或算子分配相应的时间资源,并进行自动调优,同时收集当前计算子图或算子的实时编译特征信息;步骤7,返回步骤2,重新开始下一个时间块资源的动态分配。
-
公开(公告)号:CN116991429B
公开(公告)日:2024-01-16
申请号:CN202311266395.5
申请日:2023-09-28
Applicant: 之江实验室
IPC: G06F8/41 , G06F18/214
Abstract: 本申请涉及一种计算机程序的编译调优方法、装置和存储介质,其中,该编译调优方法包括:选择样本硬件集合和样本程序集合并为每个样本程序随机生成优化序列,对每种样本程序与优化序列的组合进行编译、特征抽取以及运行,得到训练数据集,基于训练数据集对预设的多任务学习模型进行训练,得到预训练模型,基于预训练模型进行成本函数模型的初始化,得到目标成本函数模型,利用该目标成本函数模型对目标源程序进行调优,得到目标源程序的最优优化序列。通过本申请,解决了相关技术中计算机程序编译调优效率低下的问题,提高了计算机程序的编译调优效率。
-
公开(公告)号:CN117372713A
公开(公告)日:2024-01-09
申请号:CN202311286450.7
申请日:2023-10-08
Applicant: 之江实验室
IPC: G06V10/44 , G06V10/25 , G06V20/64 , G06N3/0495 , G06N3/0464 , G06N3/082
Abstract: 本发明公开了一种基于通道剪枝的单目三维目标检测方法及装置,该方法是通过预处理将三维雷达点云数据编码到BEV图中作为输入,利用卷积神经网络模型进行特征提取及目标检测,并采用通道剪枝方案大幅减少模型参数和计算量,从而实现模型的精简、推理速度的提高及检测性能的优化。此外,本发明所提出的方法还保持了原有三维目标检测模型的准确性和稳定性,并适用于单目三维目标检测任务。该发明在自动驾驶、智能机器人、视频监控等领域具有广泛应用前景。
-
公开(公告)号:CN117370536A
公开(公告)日:2024-01-09
申请号:CN202311673949.3
申请日:2023-12-07
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备。可以将用户输入的指定文本输入到预先训练的语言模型中,以通过语言模型确定指定文本对应的文本特征表示,并可以确定每个候选问题文本特征表示与文本特征表示之间的相关度,以根据相关度,从各候选问题文本特征表示中确定出与文本特征表示相匹配的候选问题文本特征表示,作为目标问题文本特征表示,并根据目标问题文本特征表示与所述文本特征表示之间的相关度是否低于预设的相关度阈值,确定是否向用户请求补充文本信息,以及是否将预先确定的目标问题文本特征表示对应的回复文本,作为指定文本对应的目标回复文本回复给用户。
-
公开(公告)号:CN117034721B
公开(公告)日:2024-01-02
申请号:CN202311289898.4
申请日:2023-10-08
Applicant: 之江实验室
IPC: G06F30/23 , G06F30/27 , G06N3/042 , G06N3/084 , G06F119/08
Abstract: 本发明公开了一种面向芯粒集成设计的图神经网络温度场预测方法和装置,包含:根据有限元网格划分,将网格单元视为图数据的节点,相邻的两个网格单元用边连接,获得由节点和边组成的封装结构的图数据;根据网格单元顶点位置信息、材料属性、仿真问题的初值条件和边值条件,获得节点的初始编码;设计深度图神经网络模型,首先获得节点和边在高维空间的投射,然后让节点聚合边的信息,边聚合节点的信息,最后将节点信息解码为温度数值;根据物理方程设计损失函数并训练模型;用训练好的模型进行温度分布预测;最后将网格单元的温度用插值方法计算每个顶点的温度。
-
公开(公告)号:CN116777010B
公开(公告)日:2023-12-19
申请号:CN202311080508.2
申请日:2023-08-25
Applicant: 之江实验室
IPC: G06N20/00
Abstract: 本说明书公开了一种模型训练的方法以及任务执行方法及装置,可以将获取到的在指定空间中混合物态在第一时刻下的各物理场数据输入到预测模型中,来训练该预测模型,这样一来,在将训练后的预测模型应用到实际任务执行的过程中时,相比于现有技术并不需要耗费过多的时间来一步步推导出下一时刻的指定空间中混合物态在第二时刻下的各物理场数据,这样不仅提高了预测物理场数据的效率,而且由于在训练阶段,是以混合物态在第一时刻和第二时刻前后之间的质量分布符合质量约束为条件,对预测模型进行训练,所以可以保证预测模型在实际应用中所预测出的物理场数据的准确性。(56)对比文件Shuai Wang et al..Multi-scalenumerical simulation of fluidized beds:Model applicability assessment.《Particuology 80》.2022,11-41.
-
公开(公告)号:CN116776135B
公开(公告)日:2023-12-19
申请号:CN202311072802.9
申请日:2023-08-24
Applicant: 之江实验室
IPC: G06F18/2136 , G06N3/0464
Abstract: 本说明书公开了一种基于神经网络模型的物理场数据预测方法及装置,可以根据物理场数据整体在数据空间中各空间区域的数据稀疏情况,来对物理场数据进行划分,得到各分块数据,这样可以将具有计算价值的数据从物理场数据的整体中分割出来,使得预测模型对有价值的分块数据进行计算,以完成物理场数据的预测任务,从而相比于现有技术来说,可以显著的提升预测模型的运算效率。
-
-
-
-
-
-
-
-
-