-
公开(公告)号:CN115249315B
公开(公告)日:2023-02-03
申请号:CN202211148079.3
申请日:2022-09-21
Applicant: 之江实验室
IPC: G06V10/764 , G06N20/00 , G06F9/48
Abstract: 本发明公开了面向异构计算设备的深度学习图像分类方法及装置,将深度学习模型建模为一个有向无环图,有向无环图的节点表深度学习模型的算子,节点之间的有向边代表深度学习模型算子间的数据传输;根据算子分别在各异构计算设备上的处理时间为节点赋值,根据算子间数据在两个计算设备间的传输时间为节点之间的有向边赋值;将每个节点之间的有向边替换为新的节点,并增加两条有向边,保持有向无环图的拓扑结构,用原有向边的权重为新的节点赋值;对算子的内存占用、设备的内存限制、算子在设备上的执行顺序、设备与设备间的数据传输、设备与设备间的数据传输顺序建模,模型的目标函数是模型的端到端推理时延,从而得到最小时延的模型。
-
公开(公告)号:CN116880995A
公开(公告)日:2023-10-13
申请号:CN202311158944.7
申请日:2023-09-08
Applicant: 之江实验室
IPC: G06F9/48 , G06N3/0464
Abstract: 本说明书公开了一种模型任务的执行方法、装置、存储介质及电子设备,确定运行神经网络模型的任务,对神经网络模型进行解析,得到模型算子以及模型算子信息。根据模型算子以及模型算子之间的张量传递关系,确定任务中的各子任务以及各子任务之间的连接关系,确定各子任务的调用函数。将各子任务以及各子任务的调用函数发送至分布式系统中的各边缘服务器,根据各子任务之间的连接关系,控制边缘服务器执行各子任务。该方法实现了对神经网络模型从模型算子层面的拆分,并使用分布式系统运行各子任务,在不影响神经网络模型的精度的前提下,提高了神经网络模型的推理速度,降低了对单个服务器的算力需求以及存储需求。
-
公开(公告)号:CN116310165A
公开(公告)日:2023-06-23
申请号:CN202310100221.5
申请日:2023-02-06
Applicant: 之江实验室
Abstract: 本说明书公开了一种三维地图的构建方法及装置,可以接收地图构建指令,而后,创建并运行监听容器以及创建目标任务,目标任务用于拆分三维地图的构建任务来得到各子构建任务,继而,根据监听容器的任务状态监听接口,监听目标任务是否完成,若确定目标任务完成,从目标集群中确定至少部分数据处理设备,并将得到的各子构建任务分配给至少部分数据处理设备,以使每个数据处理设备在接收到分配给自身的子构建任务后,根据获取到的用于执行分配给自身的子构建任务所需的二维图像数据,构建出局部三维地图;若根据监听容器的任务状态监听接口,确定各子构建任务均已完成,将各局部三维地图进行融合,以得到三维地图,从而提高了三维地图构建的效率。
-
公开(公告)号:CN116880995B
公开(公告)日:2024-01-09
申请号:CN202311158944.7
申请日:2023-09-08
Applicant: 之江实验室
IPC: G06F9/48 , G06N3/0464
Abstract: 本说明书公开了一种模型任务的执行方法、装置、存储介质及电子设备,确定运行神经网络模型的任务,对神经网络模型进行解析,得到模型算子以及模型算子信息。根据模型算子以及模型算子之间的张量传递关系,确定任务中的各子任务以及各子任务之间的连接关系,确定各子任务的调用函数。将各子任务以及各子任务的调用函数发送至分布式系统中的各边缘服务器,根据各子任务之间的连接关系,控制边缘服务器执行各子任务。该方法实现了对神经网络模型从模型算子层面的拆分,并使用分布式系统运行各子任务,在不影响神经网络模型的精度的前提下,提高了神经网络模型的推理速度,降低了对单个服务器的算力需求以及存储需求。
-
公开(公告)号:CN115937452A
公开(公告)日:2023-04-07
申请号:CN202211677082.4
申请日:2022-12-26
IPC: G06T17/05 , G06V10/762 , G06V10/80 , G06V10/10
Abstract: 本发明公开了一种基于分布式计算的地图重建方法与系统,包括:采集场景图像,对场景图像进行稀疏重建,并获取各个场景图像对应的相机姿态;分析相机位姿和场景图像间的共视关系,将稀疏重建后的场景图像集合划分为若干个子集合;根据子集合中的场景图像构造各个节点所需的数据包;将数据包分发到各个节点中进行解析,得到图像深度估计任务;子节点对数据包所包含的图像集合进行深度估计,得到各个场景图像逐像素的深度信息;各个节点对深度信息进行深度融合形成稠密点云片段;子节点将稠密点云片段传输至主节点,主节点进行稠密点云融合,并进行完整稠密点云的面片化和贴图,得到地图重建结果。
-
公开(公告)号:CN115249315A
公开(公告)日:2022-10-28
申请号:CN202211148079.3
申请日:2022-09-21
Applicant: 之江实验室
IPC: G06V10/764 , G06N20/00 , G06F9/48
Abstract: 本发明公开了面向异构计算设备的深度学习图像分类方法及装置,将深度学习模型建模为一个有向无环图,有向无环图的节点表深度学习模型的算子,节点之间的有向边代表深度学习模型算子间的数据传输;根据算子分别在各异构计算设备上的处理时间为节点赋值,根据算子间数据在两个计算设备间的传输时间为节点之间的有向边赋值;将每个节点之间的有向边替换为新的节点,并增加两条有向边,保持有向无环图的拓扑结构,用原有向边的权重为新的节点赋值;对算子的内存占用、设备的内存限制、算子在设备上的执行顺序、设备与设备间的数据传输、设备与设备间的数据传输顺序建模,模型的目标函数是模型的端到端推理时延,从而得到最小时延的模型。
-
-
-
-
-