-
公开(公告)号:CN116880994B
公开(公告)日:2023-12-12
申请号:CN202311151854.5
申请日:2023-09-07
Applicant: 之江实验室
Abstract: 本发明公开了一种基于动态DAG的多处理器任务调度方法、装置及设备,该方法包括:根据任务之间的调度依赖关系构建DAG图;统计每一个任务在处理器上运行时间内的能量消耗;统计每一个处理器以最大频率运行时每一个任务节点的可靠性;根据DAG图计算每一个任务节点的出度并根据出度的大小降序排序构建出度队列;根据DAG图计算每一个任务节点的向上排序值并根据排序值降序构建向上排序队列;设定平衡比重参数,遍历并判断向上排序队列中的任务节点在出度队列中的相对位置,使用相关的公式进行任
-
公开(公告)号:CN117195997A
公开(公告)日:2023-12-08
申请号:CN202311464150.3
申请日:2023-11-06
Applicant: 之江实验室
IPC: G06N3/08 , G06F18/214 , G06F3/06
Abstract: 本说明书公开了一种模型训练方法、装置、存储介质及电子设备,在此方法中,待训练模型部署在本地节点的计算区中,并在本地节点中部署高速缓存区以及在计算区中部署数据生成模型。在实际模型训练过程中,将训练所需要的目标数据缓存在高速缓存区中,以便计算区从高速缓存区直接进行数据读取,来进行模型训练,若没有读取到数据,则通过数据生成模型根据索引值生成的目标数据,进一步进行模型训练,并在模型训练过程中,保证模型准确度的情况下,对模型进行模型压缩,来减少模型参量。通过减少对存储区的数据访问次数以及对模型进行模型压缩,从而在一定程度上提高模型训练效率和减少存储资源浪费。
-
公开(公告)号:CN117149778A
公开(公告)日:2023-12-01
申请号:CN202311414028.5
申请日:2023-10-30
Applicant: 之江实验室
IPC: G06F16/22 , G06F16/2455
Abstract: 本申请涉及稀疏张量运算加速领域,特别是涉及一种稀疏张量运算加速方法、系统、计算机设备和存储介质,所述方法包括:读取两稀疏张量的压缩表示元数据信息,确定各稀疏张量中非零元素被标记为无效计算元素时所对应的另一个稀疏张量的起始非缩并维度索引和终止非缩并维度索引,并以键值对的形式存储在无效计算元素标记范围映射表中;对所述两稀疏张量进行自适应协同分块,得到所述两稀疏张量的预分块信息;基于所述无效计算元素标记范围映射表以及所述两稀疏张量的预分块信息,得到最终分块;将所述最终分块依次搬运至更内层缓存,直至完成计算。本发明减少运行时稀疏张量数据分块划分的重复性操作,进一步节省稀疏张量运算时间。
-
公开(公告)号:CN117057439A
公开(公告)日:2023-11-14
申请号:CN202310893300.6
申请日:2023-07-20
Applicant: 之江实验室
IPC: G06N20/00 , G06F18/24 , G06F17/14 , G06N3/0464 , G06F18/214
Abstract: 本申请涉及一种模型参数更新方法、装置、计算机设备和存储介质。所述方法包括:接收联邦学习服务端发送的针对各联邦学习客户端所共有的数据分布预测模型的参数更新指令;其中,参数更新指令携带数据分布预测模型的共享参数和特定参数;响应于参数更新指令,对共享参数和特定参数进行更新,得到更新后的共享参数和更新后的特定参数;将更新后的共享参数发送至联邦学习服务端,并将更新后的特定参数保留在本地;接收联邦学习服务端对共享参数聚合处理后发送的聚合共享参数;基于聚合共享参数和更新后的特定参数确定对应的目标共享参数和目标特定参数。采用本方法能够解决数据异质性问题,提高数据分布预测模型的准确性。
-
公开(公告)号:CN116992820A
公开(公告)日:2023-11-03
申请号:CN202311260288.1
申请日:2023-09-27
Applicant: 之江实验室
IPC: G06F30/398 , G06F30/394 , G06F115/12
Abstract: 本申请涉及一种基于芯粒集成的可扩展智能计算芯片结构,其中,芯片结构包括:所述芯片结构包括中间介质层以及堆叠在所述中间介质层上的I/O芯粒、内存接口芯粒、RISC‑V控制芯粒以及至少一个计算芯粒堆叠组,并基于芯粒集成技术实现各功能芯粒的互连,本发明能够根据算力需求,配置计算芯粒堆叠组内部的计算核心数量,也可以配置计算芯粒堆叠组的数量,以配合其他功能芯粒,灵活地搭建智能计算芯片系统,具有高度可扩展性,各个功能芯粒可以不具备完整的功能,可以只具备实现特定功能的能力,各芯粒按照设计要求,进行灵活配置,满足针对不同场景的定制化需求,最大程度实现智能计算芯片的柔性定制。
-
公开(公告)号:CN116991429A
公开(公告)日:2023-11-03
申请号:CN202311266395.5
申请日:2023-09-28
Applicant: 之江实验室
IPC: G06F8/41 , G06F18/214
Abstract: 本申请涉及一种计算机程序的编译调优方法、装置和存储介质,其中,该编译调优方法包括:选择样本硬件集合和样本程序集合并为每个样本程序随机生成优化序列,对每种样本程序与优化序列的组合进行编译、特征抽取以及运行,得到训练数据集,基于训练数据集对预设的多任务学习模型进行训练,得到预训练模型,基于预训练模型进行成本函数模型的初始化,得到目标成本函数模型,利用该目标成本函数模型对目标源程序进行调优,得到目标源程序的最优优化序列。通过本申请,解决了相关技术中计算机程序编译调优效率低下的问题,提高了计算机程序的编译调优效率。
-
公开(公告)号:CN116931955A
公开(公告)日:2023-10-24
申请号:CN202311202659.0
申请日:2023-09-18
Applicant: 之江实验室
Abstract: 本说明书公开了基于人工智能的编译器自动调优方法及装置,在此方法中,将程序输入到模型中得到各优化序列,编译器针对每个优化序列对程序进行编译运行得到实际运行时间,据此来调整智能体模型输出各优化序列的概率,使得训练后的智能体模型能够输出最优的优化序列,而编译器使用最优优化序列对待运行程序进行编译优化,从而在一定程度上提高运行效率和减少资源浪费。
-
公开(公告)号:CN116896532A
公开(公告)日:2023-10-17
申请号:CN202310902761.5
申请日:2023-07-21
Applicant: 之江实验室
IPC: H04L47/12 , H04L69/163 , H04L43/0882
Abstract: 本发明公开了一种面向最小带宽保障的网络拥塞控制方法,所述方法包括以下步骤:(1)区分网络流的类型,所述类型包括截止时间流和非截止时间流;(2)根据网络流的类型设置最小窗口值;(3)在拥塞控制的各阶段调节拥塞窗口时,根据最小窗口值和拥塞程度对拥塞窗口值进行调整。本本发明还公开了一种面向最小带宽保障的网络拥塞控制装置及计算机可读存储介质,用于实现上述面向最小带宽保障的网络拥塞控制方法。发明通过区分时间截止流和非截止时间流,保障TCP截止流最小带宽,也能达到拥塞控制的目的。
-
公开(公告)号:CN116880994A
公开(公告)日:2023-10-13
申请号:CN202311151854.5
申请日:2023-09-07
Applicant: 之江实验室
Abstract: 本发明公开了一种基于动态DAG的多处理器任务调度方法、装置及设备,该方法包括:根据任务之间的调度依赖关系构建DAG图;统计每一个任务在处理器上运行时间内的能量消耗;统计每一个处理器以最大频率运行时每一个任务节点的可靠性;根据DAG图计算每一个任务节点的出度并根据出度的大小降序排序构建出度队列;根据DAG图计算每一个任务节点的向上排序值并根据排序值降序构建向上排序队列;设定平衡比重参数,遍历并判断向上排序队列中的任务节点在出度队列中的相对位置,使用相关的公式进行任务节点的调度分配,直到遍历完节点完成调度分配。通过本发明方法能够在能量损耗、及时性和可靠性上达到较好的平衡,提高任务调度性能。
-
公开(公告)号:CN116795324A
公开(公告)日:2023-09-22
申请号:CN202310810589.0
申请日:2023-07-03
Applicant: 之江实验室
Abstract: 本申请涉及一种混合精度浮点乘法装置和混合精度浮点数处理方法。所述装置通过指数偏置模块确定从寄存器中获取的至少两个浮点操作数的偏置,将各浮点操作数的偏置输入至对应的第一加法器以及将其结果输出至第二加法器,通过第一加法器利用各浮点操作数的偏置分别对各浮点操作数对应的指数进行偏置处理,确定各浮点操作数的偏置指数值,通过第二加法器对各浮点操作数的偏置指数值进行加法运算,得到中间指数值,通过精度转换单元,用于根据乘法单元输出的浮点数精度标注位确定目标浮点操作数的目标精度,基于目标精度对乘法单元输出的中间尾数和中间指数值进行转换,完成目标操作数的精度转换。采用本装置能够提高混合精度计算效率。
-
-
-
-
-
-
-
-
-