一种数据传输装置及传输方法

    公开(公告)号:CN111459856B

    公开(公告)日:2022-02-18

    申请号:CN202010200676.0

    申请日:2020-03-20

    Abstract: 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。

    一种数据传输装置及传输方法

    公开(公告)号:CN111459856A

    公开(公告)日:2020-07-28

    申请号:CN202010200676.0

    申请日:2020-03-20

    Abstract: 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。

    一种用于异构图神经网络的推理加速器及加速推理方法

    公开(公告)号:CN118036688A

    公开(公告)日:2024-05-14

    申请号:CN202410248479.4

    申请日:2024-03-05

    Abstract: 本发明提供一种用于异构图神经网络的推理加速器,示意性地在该加速器中增加了图解耦器和图重组器来对异构图进行结解耦和重组的方式来进行子图划分,并将其发送至下游处理部件进行处理以实现对异构图神经网络的推理。采用本发明上述实施例通过在加速器中增加图解耦器和图重组器将异构图对应的语义图划分为局部性较强的多个子图,从而缓解了加速器在处理过程中产生的缓存抖动,同时对语义图对应的多个子图的处理等价为对原语义图的处理,在保证了处理正确性的同时也提升了加速器的执行性能。

    一种用于数据流架构的计算设备中的路由方法

    公开(公告)号:CN114760241B

    公开(公告)日:2023-06-02

    申请号:CN202210461301.9

    申请日:2022-04-28

    Abstract: 本发明提供了一种用于数据流架构的计算设备中的路由方法,计算设备包括多个处理单元和多个路由节点,每个处理单元直接连接一个路由节点并且被关联为该路由节点对应的本地处理单元,多个路由节点之间相互连接,方法包括:在每个路由节点,获取各方向发往本地处理单元的数据并为其中每个方向发来的数据分别维护相应的缓存队列,缓存队列为阻塞队列;在每个路由节点,确定各方向发往本地处理单元的数据对应的缓存队列中处于队列头部的数据包的供数优先级,以及根据供数优先级选择将多个队列中的一个队列的头部的数据包发送给本地处理单元,供数优先级与本地处理单元中需要该头部数据包中操作数的指令距离转为就绪状态还需到达的操作数个数相关。

    高通量众核数据流处理器及其任务执行方法

    公开(公告)号:CN114489809A

    公开(公告)日:2022-05-13

    申请号:CN202111673269.2

    申请日:2021-12-31

    Abstract: 本发明提出一种高通量众核数据流处理器,包括:多个处理单元,相互通信连接形成该处理器的片上网络结构;每个该处理单元包括多个子处理单元,该子处理单元包括指令子存储器和数据子存储器,多个该子处理单元以阵列结构排列,且相互通信连接形成该处理单元的多跳网络结构;配置单元,与每个该子处理单元通信连接。以及该高通量众核数据流处理器的任务执行方法。该发明相对于以往技术具有较好的可扩展性,控制逻辑简单,适用于大规模众核结构。同时支持SIMD‑MIMD‑Systolic模式可配、规模可配、区域可配等优势,灵活性更强,适用于更为通用的应用领域处理。

    硬件筛选器、图神经网络加速器及其片外访存筛选方法

    公开(公告)号:CN119988246A

    公开(公告)日:2025-05-13

    申请号:CN202510069404.4

    申请日:2025-01-16

    Abstract: 本发明提出一种硬件筛选器、图神经网络加速器及其片外访存筛选方法,该方法包含:接收来自图神经网络加速器内部的稀疏访存请求,并按照DRAM访问的最小单位burst对该稀疏访存请求分组为若干burst请求;对输入的所述若干burst请求执行至少一轮筛选,识别每一轮中待保留的所述burst请求与待筛除的所述burst请求;由内存控制器接收所述最终一轮的待保留的所述burst请求返回正确访存结果;接收所有轮的待筛除的所述burst请求生成虚假零值结果;获取该正确访存结果以及该虚假零值结果生成稀疏访存结果反馈至图神经网络加速器。该方法在不影响模型精度的前提下,降低了访存量,实现访存的局部性改善和系统的性能提升。

    基于阻变存储器的通用区块链应用处理加速方法及系统

    公开(公告)号:CN110890120B

    公开(公告)日:2021-08-31

    申请号:CN201911001197.X

    申请日:2019-10-21

    Abstract: 本发明提出一种基于阻变存储器的通用区块链应用处理加速方法及系统,包括:判断当前程序是否为区块链加速处理程序,若是,则将当前程序发送至包括存储处理器和阻变存储器的HMC存储器端,其中存储处理器集成在HMC存储器端的逻辑控制层,阻变存储器集成在HMC存储器端的立体存储层,存储处理器通过控制立体存储层,以数据流运行的方式完成对当前程序的近存储计算,得到当前程序的执行结果,并将其回传至主处理器端,否则主处理端中的乱序核根据当前程序,以控制流运行的方式执行当前程序,得到执行结果。本发明具有较高的执行速度和显著的能效比提升,并结合数据流任务分配和执行模式,能够获得更高的执行效率和能效。

    一种基于异构图神经网络的异构图数据加速处理方法

    公开(公告)号:CN118536564A

    公开(公告)日:2024-08-23

    申请号:CN202410652421.6

    申请日:2024-05-24

    Abstract: 本发明提供了一种基于异构图神经网络的异构图数据加速处理方法,所述方法执行特征映射计算步骤、以及语义融合计算步骤以完成异构图数据的处理,其中,在邻居聚合计算步骤中,基于映射后的子图中目标节点和各个源节点的特征向量对该子图进行剪枝计算以筛选出该子图中对目标节点符合预设重要性要求的多个源节点,并基于映射后的目标节点和筛选出的各个源节点的特征向量执行邻居聚合计算以得到子图中目标节点对应的结构特征向量。本发明的方案能够在保证异构图神经网络准确地捕捉图数据中的重要信息的同时减小异构图神经网络处理异构图数据过程中的计算复杂度和片外访存带宽的需求,从而提高异构图神经网络处理异构图数据时的执行效率。

    一种流图程序生成方法和采用该方法的粗粒度数据流装置

    公开(公告)号:CN118152090A

    公开(公告)日:2024-06-07

    申请号:CN202410156325.2

    申请日:2024-02-04

    Abstract: 本发明提供了一种应用于处理器的流图程序生成方法,其中,流图程序为指示粗粒度数据流架构下计算任务的数据流图,所述粗粒度数据流架构包括执行阵列,所述执行阵列包括多个执行单元,所述方法包括对算子任务执行如下步骤:S1、获取粗粒度数据流架构的参数,所述参数至少包括执行单元个数、可同时支持的并行任务个数;S2、基于算子任务并行计算特征以及所述步骤S1中获取的架构参数,将算子任务划分为一个或多个分任务,其中,分任务个数应小于或等于所述粗粒度数据流架构可同时支持的并行任务个数;S3、将每个分任务进一步划分成多个子任务,每个子任务执行不同的一个或多个功能;S4、按照预设的规则对每个子任务进行流图程序编码。

    一种用于数据流架构的计算设备的数据处理方法

    公开(公告)号:CN115016918A

    公开(公告)日:2022-09-06

    申请号:CN202210769041.1

    申请日:2022-06-30

    Abstract: 本发明实施例提供了一种用于数据流架构的计算设备的数据处理方法,所述计算设备包括多个计算节点和多个路由节点,每个计算节点用于调度执行指令槽中的指令,每个路由节点包括共享缓存,所述共享缓存用于缓存指令执行后的数据,共享缓存中指令执行后的数据被发送完毕后释放该数据占用的共享缓存空间,所述方法包括在计算节点执行如下操作:获取指令槽中所有处于就绪可执行状态的指令,对比获取到的所有指令被执行后的数据占用共享缓存后释放共享缓存空间的快慢,选择其中被执行后得到的数据占用的共享缓存空间被最快释放的优选指令进行执行。本发明每次选择当前能够最快释放共享缓存空间的优选指令进行执行,提升数据流架构的效率。

Patent Agency Ranking