-
公开(公告)号:CN113535387A
公开(公告)日:2021-10-22
申请号:CN202110699347.X
申请日:2021-06-23
Applicant: 之江实验室
Abstract: 本发明公开了一种异构感知的GPU资源分配与调度方法及系统,方法包括:S1:预分析出任务所需的性能指标;S2:任务提交后,将任务优先级设置为最高,并提交到高优先级的Q1等待队列中;S3:当可用的GPU资源发生变化后,触发调度,放置器根据GPU异构性和任务的性能指标,为任务分配GPU资源;S4:监控正在执行的任务,计算其优先级,根据优先级确定任务是否要让出GPU资源,将需要让出GPU资源的任务放入低优先级的Q2等待队列;S5:监控Q2等待队列中的任务等待时间是否超过饥饿阈值,如果超过,则该任务的优先级设为最高,并移入Q1等待队列;系统包括:调度器、放置器、探测器、高优先级和低优先级等待队列。
-
公开(公告)号:CN112015673B
公开(公告)日:2021-03-16
申请号:CN202011137494.X
申请日:2020-10-22
IPC: G06F12/02
Abstract: 本发明涉及计算机内存计算领域,具体涉及一种基于混合存储的存内计算方法与装置,该方法包括:首先通过混合存储区将数据进行混合存储,然后利用数据转存区通过字线驱动器和控制器对某一指定行的数据进行移位操作,最后基于混合存储和移位操作进行数据的乘法计算。本发明结合非易失存储与内存计算,一方面计算数据以纳秒级的速度从非易失器件中获得,特别是对于深度神经网络推理这种场景,可将模型参数事先存放于非易失存储区,计算时能减少了数据访问的时间,提高了系统性能;另一方面通过改进电路操作流程,减少了不必要的数据搬移时间,使得移位时间也能缩短至纳秒级别,提升了对于乘法计算这种有大量移位操作的计算效率,提高了系统性能。
-
公开(公告)号:CN112232528B
公开(公告)日:2021-03-09
申请号:CN202011473442.X
申请日:2020-12-15
Applicant: 之江实验室
Abstract: 本发明公开了一种联邦学习模型训练方法、装置及联邦学习系统,边缘计算服务器和端设备接收云端联邦学习子系统形成的全局机器学习模型信息;一个边缘计算服务器与一个以上的端设备利用网络局部性的优势形成区域,端设备依靠本地数据并采用截断的方式完成模型本地训练,边缘计算服务器负责所辖区域内端设备的多轮更新并向云端联邦学习子系统发送更新后的模型信息;边缘计算服务器也采用截断的方式完成模型本地训练,云端联邦学习子系统负责多个边缘计算服务器的梯度更新;在训练到达收敛期,分别对边缘计算服务器所辖区域内端设备和云端联邦学习子系统负责的多个边缘计算服务器实施截断节点的补偿,形成全局机器学习模型信息。
-
-
公开(公告)号:CN119127514B
公开(公告)日:2025-04-22
申请号:CN202411614716.0
申请日:2024-11-13
Applicant: 之江实验室
Abstract: 本发明公开了一种脉冲星傅立叶域加速搜索流水线并行方法和装置,包括:将接收的天文数据分配到多个并行进程;每个进程中包括三个串行子线程,利用第一CPU子线程对分配到的天文数据进行预处理,利用GPU子线程读取预处理后的数据并在GPU上执行加速计算得到候选信号数据,利用第二CPU子线程读取候选信号数据并进行后处理和结果汇总,同时利用多个并行进程架构的队列和队列阻塞锁来同步各子线程之间的任务状态;通过监控反馈动态调整处理流程中的进程数量;实时记录任务状态和各进程计算结果并处理异常情况。本发明能够有效提升脉冲双星搜索进程,并支持利用多GPU并行加速,大幅提升从FAST天文数据中搜索该类型天体的速度。
-
公开(公告)号:CN113535387B
公开(公告)日:2024-10-18
申请号:CN202110699347.X
申请日:2021-06-23
Applicant: 之江实验室
Abstract: 本发明公开了一种异构感知的GPU资源分配与调度方法及系统,方法包括:S1:预分析出任务所需的性能指标;S2:任务提交后,将任务优先级设置为最高,并提交到高优先级的Q1等待队列中;S3:当可用的GPU资源发生变化后,触发调度,放置器根据GPU异构性和任务的性能指标,为任务分配GPU资源;S4:监控正在执行的任务,计算其优先级,根据优先级确定任务是否要让出GPU资源,将需要让出GPU资源的任务放入低优先级的Q2等待队列;S5:监控Q2等待队列中的任务等待时间是否超过饥饿阈值,如果超过,则该任务的优先级设为最高,并移入Q1等待队列;系统包括:调度器、放置器、探测器、高优先级和低优先级等待队列。
-
公开(公告)号:CN117744726A
公开(公告)日:2024-03-22
申请号:CN202311698790.0
申请日:2023-12-12
Applicant: 之江实验室
IPC: G06N3/063 , G06F9/50 , G06F15/173
Abstract: 本发明公开了一种面向芯粒故障感知的神经网络开销估计方法和系统,该方法包括以下步骤:获取芯粒故障后的不规则芯粒拓扑结构、不规则芯粒路由表、芯粒参数信息和算子参数信息;基于不规则芯粒拓扑结构和不规则芯粒路由表获取神经网络计算图在芯粒系统上的故障感知的调度策略,包括计算图、算子划分与资源数量分配策略和算子映射策略;对深度学习并行训练系统进行神经网络推理开销估计,包括获取计算开销、争用开销、算子内通信开销和算子间通信开销。本发明方法能够通过对故障芯粒的建模实现对神经网络在芯粒上的性能开销进行准确估计,为芯粒的设计和优化提供指导,为开发更高效的神经网络加速器提供有力支持。
-
公开(公告)号:CN116977525B
公开(公告)日:2024-03-01
申请号:CN202310956092.X
申请日:2023-07-31
Applicant: 之江实验室
Abstract: 本说明书公开了一种图像渲染方法、装置、存储介质及电子设备。所述图像渲染方法包括:将预设的三维渲染计算框架展示给用户,以使用户从预设的三维渲染计算框架所提供的各组件中,选取出用于构建用户所需的三维场景模型的神经辐射场的各组件,作为各目标组件,其中,各组件包括:编码函数组件、多层感知器组件、损失函数组件。根据各目标组件,构建三维场景模型对应的目标神经辐射场,响应用户发送的渲染请求,通过构建出的目标神经辐射场进行渲染得到三维场景模型的渲染图像。
-
公开(公告)号:CN116225669B
公开(公告)日:2024-01-09
申请号:CN202310509060.5
申请日:2023-05-08
Applicant: 之江实验室
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备,可以预先确定出所有可以并行执行的算子组合,进而可以在响应于用户发起的任务请求进行任务执行时,确定需要执行该任务对应的各可执行算子与正在执行其他任务的芯片正在执行的其他任务的算子是否有匹配的可以并行执行的算子组合,若有,则可以通过正在执行其他任务的芯片并行执行该任务请求对应的任务,从而可以提升芯片的计算资源的利用率。
-
公开(公告)号:CN117056279A
公开(公告)日:2023-11-14
申请号:CN202311320181.1
申请日:2023-10-12
Applicant: 之江实验室
IPC: G06F15/78 , H01L23/538 , H01L23/528 , H01L21/60
Abstract: 本申请提供一种可重构电路、可重构芯粒间互联的装置及其方法。该可重构电路包括可重构互联模块及控制模块,可重构互联模块用于与一个微凸点组对应连接,微凸点组包括多个微凸点。可重构互联模块包括多个可重构的开关单元。每一个开关单元具有控制端、输入端及输出端,开关单元的控制端连接到控制模块,开关单元的输入端用于接收来自功能模块或测试模块的接口信号,开关单元的输出端用于连接微凸点组中的一个微凸点。控制模块用于接收外部的控制数据,并根据控制数据来控制可重构互联模块中多个开关单元的通断以选择合适的微凸点连通。在开关单元闭合时,与开关单元连接的对应微凸点连通,接口信号可通过开关单元的输入端传递到微凸点。
-
-
-
-
-
-
-
-
-