基于数据流架构的快速傅里叶变换方法、系统和存储介质

    公开(公告)号:CN110008436B

    公开(公告)日:2021-03-26

    申请号:CN201910171401.6

    申请日:2019-03-07

    Abstract: 本发明涉及一种基于数据流架构的快速傅里叶变换方法、系统和存储介质,包括:从X个源操作数中按照码位倒置顺序载入2(log2X‑log2Y)个源操作数和旋转因子,Y为处理单元数,以在处理单元本地完成log2X‑log2Y层蝶形运算,得到运算结果;设运算层数Q=1;将Y个处理单元标号分别对应1至Y,保存各处理单元与标号的对应关系构成序列表,序列表中有标识位,初始化所有处理单元标识位都为true;在序列表中选择标号最小且标识位为true的处理单元PEi,将其与编号为i+2Q‑1的处理单元构成交换对,并将交换对中两个PE的标志位更改为false;直到所有处理单元标识位均为false,各交换对包括的处理单元间交换运算结果以完成一层蝶形运算,Q自加1;直到Q为log2X时输出运算结果。

    一种神经网络剪枝方法及装置

    公开(公告)号:CN112183744A

    公开(公告)日:2021-01-05

    申请号:CN202011022302.0

    申请日:2020-09-25

    Abstract: 一种神经网络剪枝装置,包括:存储模块、预处理模块、执行模块以及运算结果缓冲模块;存储模块,用于存储神经网络的权重矩阵和特征矩阵并且为预处理模块提供权重矩阵中的权值与特征矩阵中的特征值的操作数;预处理模块,用于计算存储模块提供的操作数的前导0的个数和,并且当前导0的个数和大于等于一精度阈值时,操作数不送入执行模块,直接得到一近似结果并将近似结果写回运算结果缓冲模块,否则,将操作数送入执行模块进行运算;执行模块,用于对预处理模块送入的操作数进行运算,并将一运算结果写回运算结果缓冲模块;运算结果缓冲模块,用于存储近似结果和运算结果。

    一种数据传输装置及传输方法

    公开(公告)号:CN111459856A

    公开(公告)日:2020-07-28

    申请号:CN202010200676.0

    申请日:2020-03-20

    Abstract: 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。

    粗粒度数据流架构执行阵列的调试方法及装置

    公开(公告)号:CN111008133A

    公开(公告)日:2020-04-14

    申请号:CN201911205445.2

    申请日:2019-11-29

    Abstract: 本发明公开了一种粗粒度数据流架构执行阵列的调试装置,包括:执行阵列,包括多个执行单元,该执行单元根据程序的数据流图获取程序块,并根据调试命令对程序块进行断点调试以获取断点数据;该程序块为该程序以粗粒度进行划分的程序分块;处理器,用于生成该调试命令,并接收该断点数据;集中调试器,分别与该处理器和该执行阵列通讯连接,用于将该调试命令转发给对应的执行单元,以及将该断点数据转发给该处理器。

    一种用于区块链的处理装置及方法

    公开(公告)号:CN110211618A

    公开(公告)日:2019-09-06

    申请号:CN201910505407.2

    申请日:2019-06-12

    Abstract: 本发明提供了一种用于区块链的处理装置及方法,该装置包括:阻变存储器,其包括用于存储待处理的随机数的多个存储单元,以及用于读出或者写入数据位的字线和位线;字线控制逻辑,用于控制阻变存储器中字线的选通;位线控制逻辑,用于控制阻变存储器中位线的选通;数据获取单元,其连接到所述阻变存储器并用于从阻变存储器中接收所选通的字线上的随机数的一个或者多个数据位的输出,获得由所述字线选通的随机数的数据位的叠加值;计算及控制单元,被配置为根据数据获取单元生成的随机数数据位的叠加值进行随机数的筛选,获得随机数有效组。本发明可以减少CPU处理的数据的范围和数据量、对访存带宽的需求、计算负载、功耗,提高区块链应用处理能力。

    基于深度线索的视频场景检索方法和系统

    公开(公告)号:CN109241342A

    公开(公告)日:2019-01-18

    申请号:CN201810811468.7

    申请日:2018-07-23

    Abstract: 本发明涉及一种基于深度线索的视频场景检索方法和系统,包括:获取样本视频,并将样本视频作为输入视频;将输入视频分割为场景片段,根据场景片段的视频场景信息,提取深度线索,对深度线索构成的空间数据降维,作为空间信息描述子;对输入视频进行帧采样得到关键帧,提取关键帧的特征,作为彩色信息描述子;建立空间信息描述子与彩色信息描述子的索引关系,得到场景描述子;对所有样本视频的场景描述子建立视频场景特征库;获取待检索视频,并作为输入视频,得到待检索视频的空间描述子与彩色信息描述子,并根据待检索视频的空间描述子,检索视频场景特征库,得到初步检索结果,对初步检索结果进行彩色特征筛选得到待检索视频的最终检索结果。

    基于数据流架构加速器的注意力机制融合方法及装置

    公开(公告)号:CN119940434A

    公开(公告)日:2025-05-06

    申请号:CN202510009132.9

    申请日:2025-01-03

    Abstract: 本发明提出一种基于数据流架构加速器的注意力机制融合方法和装置,包括用于在GPDPU加速器上加速Attention计算的方法,该方法根据Attention中embedding的维度和输入序列长度的乘积来选择融合方案,对于维度较小的计算,通过预先传入转置数据的方式将所有操作融合在同一个核函数中,从而减少配置指令的时间和访存开销,对于维度较大的计算,将输入数据分块传入暂存数据缓存SPM的存储器中用于计算,将Attention的计算步骤融合为两个复用程度很高的核函数减少指令信息的配置时间。

    一种流图程序生成方法和采用该方法的粗粒度数据流装置

    公开(公告)号:CN118152090A

    公开(公告)日:2024-06-07

    申请号:CN202410156325.2

    申请日:2024-02-04

    Abstract: 本发明提供了一种应用于处理器的流图程序生成方法,其中,流图程序为指示粗粒度数据流架构下计算任务的数据流图,所述粗粒度数据流架构包括执行阵列,所述执行阵列包括多个执行单元,所述方法包括对算子任务执行如下步骤:S1、获取粗粒度数据流架构的参数,所述参数至少包括执行单元个数、可同时支持的并行任务个数;S2、基于算子任务并行计算特征以及所述步骤S1中获取的架构参数,将算子任务划分为一个或多个分任务,其中,分任务个数应小于或等于所述粗粒度数据流架构可同时支持的并行任务个数;S3、将每个分任务进一步划分成多个子任务,每个子任务执行不同的一个或多个功能;S4、按照预设的规则对每个子任务进行流图程序编码。

Patent Agency Ranking