一种可灵活配置的神经网络计算单元、计算阵列及其构建方法

    公开(公告)号:CN109409512A

    公开(公告)日:2019-03-01

    申请号:CN201811133940.2

    申请日:2018-09-27

    Abstract: 本发明公开一种可灵活配置的神经网络计算单元、计算阵列及其构建方法,神经网络计算单元包括:可配置存储模块、可配置控制模块和可时分复用的乘加计算模块;可配置存储模块包括:特征图数据缓存buffer、步长数据缓存buffer和权值数据缓存buffer;可配置控制模块包括:计数器模块和状态机模块;乘加计算模块包括:乘法器和累加器。本发明可支持任意类型的卷积计算,且支持多尺寸卷积核并行计算,充分发掘卷积神经网络计算单元的灵活性和数据重用性,大幅降低由数据搬移带来的系统功耗,提高系统的计算效率。

    支持在线学习的卷积神经网络的可重构平台及其构建方法

    公开(公告)号:CN107273970B

    公开(公告)日:2020-06-19

    申请号:CN201710331448.5

    申请日:2017-05-11

    Abstract: 本发明公开一种支持在线学习的卷积神经网络的可重构平台及其构建方法,可重构平台包括输入卷积池化级和全连接级;输入卷积池化级包括若干卷积环和采样环;全连接级包括若干全连接环;卷积环由若干卷积神经元连接成环;采样环由若干采样神经元连接成环;全连接环由若干全连接神经元连接成环;将每层神经元的环状结构通过路由相连组成完整网络,构成一种支持在线学习的卷积神经网络的可重构平台。环上顺时针或逆时针链路传递特征值,反向链路传递反向计算误差,环与环之间通过路由器节点相连接,自上而下传递特征值,自下而上传递反向误差。本发明可支持网络在线学习,充分发掘卷积神经网络的算法并行度和存储局域性,能够提升计算系统的整体性能。

    一种并行计算的系统
    3.
    发明公开

    公开(公告)号:CN109445752A

    公开(公告)日:2019-03-08

    申请号:CN201811177771.2

    申请日:2018-10-10

    Abstract: 一种并行计算的系统,包括输入端口,第一交换网络,计算阵列,第二交换网络和输出端口,其中:第一交换网络用于从输入端口接收输入数据,并根据计算阵列的不同计算模式对输入数据进行排序并输出排序后的输入数据;计算阵列用于根据不同计算模式对所述排序后的输入数据进行并行计算并输出中间数据;第二交换网络用于根据不同输出模式对所述中间数据进行排序并通过所述输出端口输出排序后的中间数据。本公开巧妙的将计算机体系结构中的交换网络应用于并行计算的系统,并根据不同的计算模式、输出模式,对输入或输出数据进行任意所需的排序,使得输入数据进入计算阵列后,通过计算阵列完成多种运算操作。

    一种并行计算的系统
    4.
    发明授权

    公开(公告)号:CN109445752B

    公开(公告)日:2019-10-15

    申请号:CN201811177771.2

    申请日:2018-10-10

    Abstract: 一种并行计算的系统,包括输入端口,第一交换网络,计算阵列,第二交换网络和输出端口,其中:第一交换网络用于从输入端口接收输入数据,并根据计算阵列的不同计算模式对输入数据进行排序并输出排序后的输入数据;计算阵列用于根据不同计算模式对所述排序后的输入数据进行并行计算并输出中间数据;第二交换网络用于根据不同输出模式对所述中间数据进行排序并通过所述输出端口输出排序后的中间数据。本公开巧妙的将计算机体系结构中的交换网络应用于并行计算的系统,并根据不同的计算模式、输出模式,对输入或输出数据进行任意所需的排序,使得输入数据进入计算阵列后,通过计算阵列完成多种运算操作。

    一种可灵活配置的神经网络计算单元、计算阵列及其构建方法

    公开(公告)号:CN109409512B

    公开(公告)日:2021-02-19

    申请号:CN201811133940.2

    申请日:2018-09-27

    Abstract: 本发明公开一种可灵活配置的神经网络计算单元、计算阵列及其构建方法,神经网络计算单元包括:可配置存储模块、可配置控制模块和可时分复用的乘加计算模块;可配置存储模块包括:特征图数据缓存buffer、步长数据缓存buffer和权值数据缓存buffer;可配置控制模块包括:计数器模块和状态机模块;乘加计算模块包括:乘法器和累加器。本发明可支持任意类型的卷积计算,且支持多尺寸卷积核并行计算,充分发掘卷积神经网络计算单元的灵活性和数据重用性,大幅降低由数据搬移带来的系统功耗,提高系统的计算效率。

    一种参数化可扩展的神经网络全连接层多层互连结构

    公开(公告)号:CN107273969B

    公开(公告)日:2020-06-19

    申请号:CN201710331078.5

    申请日:2017-05-11

    Abstract: 本发明公开一种参数化可扩展的神经网络全连接层多层互连结构,包括若干层全连接层,每层全连接层例化了若干基本单元;一个基本单元连接一个路由器,同一全连接层中的基本单元经过路由器相连,形成全连接环;全连接环的路由器上下相连形成一种参数化可扩展的神经网络全连接层多层互连结构,支持双向的数据传递(前向推理,反向学习)。本发明采用可配置的全连接基本单元作为全连接层硬件实现的基础,用户可以根据实际使用的神经网络的需求通过设置参数控制生成多个基本单元并互连的方式完成其网络中全连接层的设计实现和并行加速;本发明的设计考虑了数据流水线,缩短了系统运行时钟周期,灵活配置全连接层的结构和规模,便于系统的快速部署实现。

    支持在线学习的卷积神经网络的可重构平台及其构建方法

    公开(公告)号:CN107273970A

    公开(公告)日:2017-10-20

    申请号:CN201710331448.5

    申请日:2017-05-11

    Abstract: 本发明公开一种支持在线学习的卷积神经网络的可重构平台及其构建方法,可重构平台包括输入卷积池化级和全连接级;输入卷积池化级包括若干卷积环和采样环;全连接级包括若干全连接环;卷积环由若干卷积神经元连接成环;采样环由若干采样神经元连接成环;全连接环由若干全连接神经元连接成环;将每层神经元的环状结构通过路由相连组成完整网络,构成一种支持在线学习的卷积神经网络的可重构平台。环上顺时针或逆时针链路传递特征值,反向链路传递反向计算误差,环与环之间通过路由器节点相连接,自上而下传递特征值,自下而上传递反向误差。本发明可支持网络在线学习,充分发掘卷积神经网络的算法并行度和存储局域性,能够提升计算系统的整体性能。

    一种参数化可扩展的神经网络全连接层多层互连结构

    公开(公告)号:CN107273969A

    公开(公告)日:2017-10-20

    申请号:CN201710331078.5

    申请日:2017-05-11

    Abstract: 本发明公开一种参数化可扩展的神经网络全连接层多层互连结构,包括若干层全连接层,每层全连接层例化了若干基本单元;一个基本单元连接一个路由器,同一全连接层中的基本单元经过路由器相连,形成全连接环;全连接环的路由器上下相连形成一种参数化可扩展的神经网络全连接层多层互连结构,支持双向的数据传递(前向推理,反向学习)。本发明采用可配置的全连接基本单元作为全连接层硬件实现的基础,用户可以根据实际使用的神经网络的需求通过设置参数控制生成多个基本单元并互连的方式完成其网络中全连接层的设计实现和并行加速;本发明的设计考虑了数据流水线,缩短了系统运行时钟周期,灵活配置全连接层的结构和规模,便于系统的快速部署实现。

Patent Agency Ranking