计算装置、资源分配的方法及多径神经网络分析器

    公开(公告)号:CN111476344B

    公开(公告)日:2024-12-31

    申请号:CN202010070764.3

    申请日:2020-01-21

    Abstract: 本发明提供一种多径神经网络、资源分配的方法及多径神经网络分析器。所述资源分配的方法可使用包含接口和处理装置的多径神经网络分析器来为多径神经网络最优地分配。接口接收多径神经网络。处理装置生成多径神经网络,以包含通过多径神经网络的关键路径的一个或多个层,所述一个或多个层分配有可用以执行多径神经网络的第一计算资源分配。关键路径限制多径神经网络的吞吐量。第一计算资源分配将多径神经网络的执行时间减少到小于用于多径神经网络的第二计算资源分配的基线执行时间。用于关键路径的第一层的第一计算资源分配不同于用于关键路径的第一层的第二计算资源分配。

    用于在存储附近进行分级排序加速的系统和方法

    公开(公告)号:CN112749107B

    公开(公告)日:2023-07-25

    申请号:CN202011101690.1

    申请日:2020-10-15

    Abstract: 一种存储系统,包括:用于存储与排序操作相关联的数据元素数组的存储设备;用于促进存储设备和主机计算机之间的通信的存储接口;以及,可通信地连接到存储设备的可重构处理设备,可重构处理设备包括:用于存储从存储设备读取的输入数据的存储器,输入数据对应于存储在存储设备中的数据元素数组;以及,包括一个或多个计算组件的内核,该内核根据从主机计算机接收到的排序命令对存储在存储器中的输入数据执行排序操作。可重构处理设备用于动态地实例化一个或多个计算组件以加速排序操作。

    用于合并联接操作的加速的系统、方法和设备

    公开(公告)号:CN114696995A

    公开(公告)日:2022-07-01

    申请号:CN202111611294.8

    申请日:2021-12-27

    Abstract: 一种处理数据的方法可以包括:接收与第一数据相关联的第一密钥流;接收与第二数据相关联的第二密钥流;并行地比较第一密钥的批次和第二密钥的批次;从该比较中收集一个或多个结果;以及从该收集中聚集一个或多个结果。该收集可以包括归约索引矩阵和掩模矩阵。聚集一个或多个结果可以包括将来自该收集的一个或多个结果的至少一部分存储在剩余向量中。聚集一个或多个结果还可以包括组合来自第一循环的剩余向量的至少一部分与来自第二循环的收集的一个或多个结果的至少一部分。

    多径神经网络、资源分配的方法及多径神经网络分析器

    公开(公告)号:CN111476344A

    公开(公告)日:2020-07-31

    申请号:CN202010070764.3

    申请日:2020-01-21

    Abstract: 本发明提供一种多径神经网络、资源分配的方法及多径神经网络分析器。所述资源分配的方法可使用包含接口和处理装置的多径神经网络分析器来为多径神经网络最优地分配。接口接收多径神经网络。处理装置生成多径神经网络,以包含通过多径神经网络的关键路径的一个或多个层,所述一个或多个层分配有可用以执行多径神经网络的第一计算资源分配。关键路径限制多径神经网络的吞吐量。第一计算资源分配将多径神经网络的执行时间减少到小于用于多径神经网络的第二计算资源分配的基线执行时间。用于关键路径的第一层的第一计算资源分配不同于用于关键路径的第一层的第二计算资源分配。

    用于分片创建的装置和系统
    17.
    发明公开

    公开(公告)号:CN111324777A

    公开(公告)日:2020-06-23

    申请号:CN201911151417.7

    申请日:2019-11-21

    Abstract: 根据一个一般方面,一种用于分片创建的装置可包括主机处理器接口电路,所述主机处理器接口电路被配置成与外部主机处理器电路传送数据及命令。所述装置可包括控制器处理器电路,所述控制器处理器电路被配置成将图形数据元合并成合并动态分片,其中合并动态分片包括相同数目的图形数据元。所述装置可包括非易失性存储器,所述非易失性存储器被配置成将数据存储在至少部分的图形结构中,其中图形结构包括各自包含顶点及边缘的数据元,且其中数据元的子部分被分组成分片。也提供一种用于分片创建的系统。

    用于机器学习的系统和机器学习系统中密钥值存取的方法

    公开(公告)号:CN119861870A

    公开(公告)日:2025-04-22

    申请号:CN202411905846.X

    申请日:2019-01-21

    Inventor: 李周桓 奇亮奭

    Abstract: 本发明提供一种用于机器学习的系统和机器学习系统中密钥值存取的方法。系统包含具有图形处理单元存储器的图形处理单元,以及连接到图形处理单元存储器的密钥值存储器件。方法包含:利用图形处理单元将密钥值请求写入到图形处理单元存储器的输入‑输出区域中的密钥值请求队列,密钥值请求包含密钥。方法还包含利用密钥值存储器件从密钥值请求队列中读取密钥值请求,以及响应于密钥值请求而利用密钥值存储器件将值写入到图形处理单元存储器的输入‑输出区域,所述值与密钥值请求的密钥相对应。

    用于机器学习的系统和方法

    公开(公告)号:CN110135589B

    公开(公告)日:2025-01-10

    申请号:CN201910054704.X

    申请日:2019-01-21

    Inventor: 李周桓 奇亮奭

    Abstract: 本发明提供一种用于机器学习的系统和方法。系统包含具有图形处理单元存储器的图形处理单元,以及连接到图形处理单元存储器的密钥值存储器件。方法包含:利用图形处理单元将密钥值请求写入到图形处理单元存储器的输入‑输出区域中的密钥值请求队列,密钥值请求包含密钥。方法还包含利用密钥值存储器件从密钥值请求队列中读取密钥值请求,以及响应于密钥值请求而利用密钥值存储器件将值写入到图形处理单元存储器的输入‑输出区域,所述值与密钥值请求的密钥相对应。

    用于在存储附近进行分级排序加速的系统和方法

    公开(公告)号:CN112749107A

    公开(公告)日:2021-05-04

    申请号:CN202011101690.1

    申请日:2020-10-15

    Abstract: 一种存储系统,包括:用于存储与排序操作相关联的数据元素数组的存储设备;用于促进存储设备和主机计算机之间的通信的存储接口;以及,可通信地连接到存储设备的可重构处理设备,可重构处理设备包括:用于存储从存储设备读取的输入数据的存储器,输入数据对应于存储在存储设备中的数据元素数组;以及,包括一个或多个计算组件的内核,该内核根据从主机计算机接收到的排序命令对存储在存储器中的输入数据执行排序操作。可重构处理设备用于动态地实例化一个或多个计算组件以加速排序操作。

Patent Agency Ranking