一种图像处理方法、装置、设备及介质

    公开(公告)号:CN114866534B

    公开(公告)日:2024-03-15

    申请号:CN202210465766.1

    申请日:2022-04-29

    Abstract: 本申请公开了一种图像处理方法、装置、设备及介质,涉及计算机技术领域,该方法应用于基于远程直接数据存取技术的图像处理单元,包括:通过网络链接获取数据端发送的原始图像数据、计算指令、第一指定地址和第二指定地址,将原始图像数据和计算指令分别存储至本地第一指定地址和第二指定地址;通过网络链接获取数据端发送的第一信息以启动计算核心,基于原始图像数据和计算指令获取图像计算结果,将图像计算结果所在的本地目标地址发送至数据端;通过网络链接获取数据端返回的与目标地址绑定的第三指定地址,将目标地址上的计算结果发送至位于所述数据端的第三指定地址上。通过网络链路获取数据端发送数据和地址提高了数据端运算资源的利用率。

    任务调度方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN115098239A

    公开(公告)日:2022-09-23

    申请号:CN202210868286.X

    申请日:2022-07-22

    Abstract: 本申请公开了一种任务调度方法、装置、电子设备及计算机可读存储介质,应用于RGPU设备端,方法包括:接收主机端下发的任务信息;根据所述任务信息确定目标任务、RGPU调用数量、当前RGPU编号;根据所述RGPU调用数量和所述当前RGPU编号从所述目标任务中划分出目标子任务;执行所述目标子任务。应用本申请所提供的技术方案,可以实现单个任务在多个RGPU上并行执行的调度,有效地提高了任务处理效率。本申请还公开了另一种应用于主机端的任务调度方法、装置、电子设备即计算机可读存储介质,同样具有上述有益效果。

    一种数据处理系统、方法及计算机系统

    公开(公告)号:CN119046211A

    公开(公告)日:2024-11-29

    申请号:CN202411534503.7

    申请日:2024-10-31

    Abstract: 本发明公开了一种数据处理系统、方法及计算机系统,涉及计算机系统领域,为解决访问扩展内存的访问路径长、访问延时大的问题,该数据处理系统包括处理板和内存扩展板,处理板上设有处理核心、第一控制器,内存扩展板上设有存储组件和控制组件。本发明能够使处理板可以对内存扩展板上的存储组件直接进行访问,而无需通过服务器主机进行内存拷贝,降低了处理板访问扩展内存时和服务器主机之间的耦合度,在有效扩展了处理板的内存的同时,缩短了处理板对扩展内存的访问路径,降低了访问延时,从而减小了预训练模型训练过程中的通信瓶颈。

    一种图像处理方法、数据处理方法、设备、介质及产品

    公开(公告)号:CN118982723A

    公开(公告)日:2024-11-19

    申请号:CN202411471758.3

    申请日:2024-10-22

    Abstract: 本发明涉及人工智能技术领域,具体公开了一种图像处理方法、数据处理方法、设备、介质及产品,通过在利用图像处理模型将输入图像进行向量化处理并进行张量计算时,对张量算子进行规模扩充至各维度的元素数量均为z个正整数的乘积形式,再进行增维处理并使各维度的增维数量相同,再进行张量列分解处理,在利用张量列分解实现将张量算子分解以及降低算子参数量的同时,适应于计算设备执行模型计算时进行张量列分解为合适形式,从而在计算设备执行图像处理任务时能够显著降低张量计算的复杂度及参数量,缓解计算压力和存储压力,且能够将一次张量计算转换为多组小规模张量算子的并行计算,在计算资源允许的情况下能够提升图像处理任务的性能。

    一种数据的读写方法、产品、数据加速器以及介质

    公开(公告)号:CN119045776B

    公开(公告)日:2025-04-25

    申请号:CN202411534508.X

    申请日:2024-10-31

    Abstract: 本发明公开了一种数据的读写方法、产品、数据加速器以及介质,涉及数据处理技术领域。将直接来自于矩阵乘加速单元的非完整行顺序的数据,在缓存中按照完整行的顺序保存,需要将其矩阵乘加速单元的结果数据输出顺序通过分片的大小和行列维度位置对应进行转换处理,以适应非矩阵乘单元对应的写入顺序;避免将矩阵乘加速单元的数据写回片外存储器后再读取的高延迟操作。在非矩阵乘单元输出的数据存储顺序将其进行填充处理,使得填充后的第三数据的矩阵维度与矩阵乘加速单元的矩阵维度相同,实现为实际计算结果生成符合矩阵乘加速单元所需要的数据维度的功能,避免将非矩阵乘加速单元的数据写回片外存储器后再读取的高延迟操作。

    一种数据处理系统、方法及计算机系统

    公开(公告)号:CN119046211B

    公开(公告)日:2025-05-09

    申请号:CN202411534503.7

    申请日:2024-10-31

    Abstract: 本发明公开了一种数据处理系统、方法及计算机系统,涉及计算机系统领域,为解决访问扩展内存的访问路径长、访问延时大的问题,该数据处理系统包括处理板和内存扩展板,处理板上设有处理核心、第一控制器,内存扩展板上设有存储组件和控制组件。本发明能够使处理板可以对内存扩展板上的存储组件直接进行访问,而无需通过服务器主机进行内存拷贝,降低了处理板访问扩展内存时和服务器主机之间的耦合度,在有效扩展了处理板的内存的同时,缩短了处理板对扩展内存的访问路径,降低了访问延时,从而减小了预训练模型训练过程中的通信瓶颈。

    一种数据的读写方法、产品、数据加速器以及介质

    公开(公告)号:CN119045776A

    公开(公告)日:2024-11-29

    申请号:CN202411534508.X

    申请日:2024-10-31

    Abstract: 本发明公开了一种数据的读写方法、产品、数据加速器以及介质,涉及数据处理技术领域。将直接来自于矩阵乘加速单元的非完整行顺序的数据,在缓存中按照完整行的顺序保存,需要将其矩阵乘加速单元的结果数据输出顺序通过分片的大小和行列维度位置对应进行转换处理,以适应非矩阵乘单元对应的写入顺序;避免将矩阵乘加速单元的数据写回片外存储器后再读取的高延迟操作。在非矩阵乘单元输出的数据存储顺序将其进行填充处理,使得填充后的第三数据的矩阵维度与矩阵乘加速单元的矩阵维度相同,实现为实际计算结果生成符合矩阵乘加速单元所需要的数据维度的功能,避免将非矩阵乘加速单元的数据写回片外存储器后再读取的高延迟操作。

    一种图像处理方法、装置、设备及介质

    公开(公告)号:CN114866534A

    公开(公告)日:2022-08-05

    申请号:CN202210465766.1

    申请日:2022-04-29

    Abstract: 本申请公开了一种图像处理方法、装置、设备及介质,涉及计算机技术领域,该方法应用于基于远程直接数据存取技术的图像处理单元,包括:通过网络链接获取数据端发送的原始图像数据、计算指令、第一指定地址和第二指定地址,将原始图像数据和计算指令分别存储至本地第一指定地址和第二指定地址;通过网络链接获取数据端发送的第一信息以启动计算核心,基于原始图像数据和计算指令获取图像计算结果,将图像计算结果所在的本地目标地址发送至数据端;通过网络链接获取数据端返回的与目标地址绑定的第三指定地址,将目标地址上的计算结果发送至位于所述数据端的第三指定地址上。通过网络链路获取数据端发送数据和地址提高了数据端运算资源的利用率。

    一种RGPU任务调度的控制方法、装置及介质

    公开(公告)号:CN115063285A

    公开(公告)日:2022-09-16

    申请号:CN202210764565.1

    申请日:2022-06-30

    Abstract: 本申请涉及任务调度技术领域,公开了一种RGPU任务调度的控制方法、装置及介质,包括:获取待执行任务的相关数据和预先设定的目标调用Core数量,从寄存器中读取每个Core的当前使用状态,并根据目标调用Core数量和每个Core的当前使用状态,确定当前空闲Core数量是否大于或等于目标调用Core数量,若是,则确定目标调用Core对应的目标Core ID,并依据目标Core ID调用目标数量的目标Core以执行待执行任务。由此,通过获取目标调用Core数量,执行待执行任务时依据目标调用Core数量调取对应数量的Core,无需人工干预,还可以避免占用所有Core导致无法为多个用户或应用服务。

Patent Agency Ranking