一种用于神经网络张量处理器的4D计算装置

    公开(公告)号:CN113642713A

    公开(公告)日:2021-11-12

    申请号:CN202110955122.6

    申请日:2021-08-19

    IPC分类号: G06N3/04 G06N3/063

    摘要: 本发明公开了一种神经网络张量处理器的4D计算装置,包括片上存储单元、dat数据流处理单元、wt数据流处理单元、两个MAC计算阵列单元和两个累加单元;其中,片上存储单元用于保存4D计算装置计算所需的dat数据和wt数据;dat数据流处理单元用于接收来自所述片上存储单元的dat数据,并根据不同的计算模式整合该dat数据,最终形成后续计算所需的dat数据,并发送给两个MAC计算阵列单元;wt数据流处理单元用于接收来自所述片上存储单元的wt数据,并根据不同的计算模式整合该wt数据,最终形成后续计算所需的wt数据,并发送给两个MAC计算阵列单元;累加单元用于实现MAC计算阵列单元计算结果的累加操作,并将累加后的计算结果进行缓存、输出,用于后续计算。

    一种神经网络张量处理器
    22.
    发明公开

    公开(公告)号:CN112381220A

    公开(公告)日:2021-02-19

    申请号:CN202011421828.6

    申请日:2020-12-08

    IPC分类号: G06N3/063

    摘要: 本发明公开了一种神经网络张量处理器,包括主控制器、重构控制器和数据流计算引擎;主控制器用于向外部控制单元提供所述神经网络张量处理器的控制和状态接口,及提供第一配置信息和第一起始信号给重构控制器;重构控制器接收第一配置信息和第一起始信号,在第一起始信号有效后,获取外部存储器的重构指令,并解析重构指令生成第二配置信息和第二起始信号;数据流计算引擎接收第二配置信息和第二起始信号,根据第二配置信息进行功能配置,在第二起始信号有效后,获取外部存储器的数据和参数以执行运算,并将计算结果写入外部存储器中。本发明的张量处理器适用于对神经网络算法进行集中化计算,具备通用性和可扩展性。

    一种数据流水线处理器系统
    23.
    发明公开

    公开(公告)号:CN112052042A

    公开(公告)日:2020-12-08

    申请号:CN202010967991.6

    申请日:2020-09-15

    IPC分类号: G06F9/38 G06N3/02

    摘要: 本发明涉及人工智能计算领域,更具体地,涉及一种数据流水线处理器系统,用于提高单位时钟周期内数据处理量以及计算资源的利用率从而提高计算效率。所述的数据流水线处理器系统包括至少两个数据流水线计算路径、参数路径、数据路径、配置控制器;所述数据路径以及参数路径为至少两个数据流水线计算路径分别提供数据和参数;至少两个数据流水线计算路径对数据路径以及参数路径分别提供的数据和参数进行运算后,输出最终计算结果;配置控制器与参数路径、数据路径以及数据流水线计算路径连接,用于获取配置信息后对树状参数路径、线性参数路径以及非线性参数路径、数据路径以及数据流水线计算路径进行配置。

    一种精简数据流指令集处理器
    24.
    发明公开

    公开(公告)号:CN117151180A

    公开(公告)日:2023-12-01

    申请号:CN202311211284.4

    申请日:2023-09-19

    IPC分类号: G06N3/063 G06F9/38

    摘要: 本发明公开了一种精简数据流指令集处理器,包含片上存储器、平面运算器、立方体运算器、点运算器、张量运算器和指令控制器;所述片上存储器直接从片外存储器读取并保存计算数据,所述计算数据用于平面运算器、立方体运算器和点运算器的计算;所述张量运算器直接从片外存储器获取数据,根据来自指令控制器的指令配置信息,对张量数据执行调换、拆分、聚合以及反向聚合操作;所述指令控制器直接从片外存储器获取指令,并根据指令向平面运算器、立方体运算器、点运算器或张量运算器发送指令配置信息。本处理器具备精简的、有限的计算类型,可在具备通用计算特性的同时,保持数据流计算架构的高效性,从而具备高算力、高主频、低能耗的优点。

    一种用于神经网络张量处理器的4D计算装置

    公开(公告)号:CN113642713B

    公开(公告)日:2023-08-01

    申请号:CN202110955122.6

    申请日:2021-08-19

    IPC分类号: G06N3/0464 G06N3/065

    摘要: 本发明公开了一种神经网络张量处理器的4D计算装置,包括片上存储单元、dat数据流处理单元、wt数据流处理单元、两个MAC计算阵列单元和两个累加单元;其中,片上存储单元用于保存4D计算装置计算所需的dat数据和wt数据;dat数据流处理单元用于接收来自所述片上存储单元的dat数据,并根据不同的计算模式整合该dat数据,最终形成后续计算所需的dat数据,并发送给两个MAC计算阵列单元;wt数据流处理单元用于接收来自所述片上存储单元的wt数据,并根据不同的计算模式整合该wt数据,最终形成后续计算所需的wt数据,并发送给两个MAC计算阵列单元;累加单元用于实现MAC计算阵列单元计算结果的累加操作,并将累加后的计算结果进行缓存、输出,用于后续计算。

    一种通用神经网络张量处理器

    公开(公告)号:CN114970844A

    公开(公告)日:2022-08-30

    申请号:CN202210031623.X

    申请日:2022-01-12

    摘要: 本发明公开了一种通用神经网络张量处理器,由指令流内核、数据流内核、系统总线、指令流外设总线和数据流外设总线五个模块组成,通过内置的具有有限计算类型的、采用数据流计算技术实现的数据流内核,提供高算力、低能耗且高性能的数据计算,同时通过内置一个具有图灵完备指令集、可无限扩展计算类型、采用指令集计算技术实现的指令流内核,提供高灵活性的数据操作(搬运、组合等),数据流内核主要负责高算力计算任务,指令流内核主要负责非计算类任务,数据流内核与指令流内核互为补充,从而实现具备算子可扩展能力、高算力、低能耗、高性能且灵活通用的神经网络加速计算。

    一种神经网络张量处理器的内建自测试系统

    公开(公告)号:CN113656310A

    公开(公告)日:2021-11-16

    申请号:CN202110954160.X

    申请日:2021-08-19

    IPC分类号: G06F11/36 G06N3/04 G06N3/063

    摘要: 本发明公开了一种神经网络张量处理器的内建自测试系统,包括内建自测试模块、选择器和神经网络张量处理模块,内建自测试模块位于外部总线与神经网络张量处理模块之间,神经网络张量处理模块通过一个总线接口和外部总线连接以实现总线信号的读写,而该总线接口通过一个由自测试使能信号控制的选择器切换到外部总线或内建自测试模块;内建自测试模块产生测试向量、控制测试流程、获取所述神经网络张量处理模块的测试结果并比对,最终通过自测试结束通过信号和自测试结束失败信号给出测试结论;神经网络张量处理模块通过一个自测试开始信号控制测试的开始和结束,根据测试流程接收测试向量执行相应的计算并输出测试结果。

    一种智能感知图像获取装置及方法

    公开(公告)号:CN113259604A

    公开(公告)日:2021-08-13

    申请号:CN202110525713.X

    申请日:2021-05-14

    摘要: 本发明公开了一种智能感知图像获取装置及方法,所述装置包含通用通道接口插座、通用通道接口控制器、中央处理器、张量处理器、图像信号处理器、DDR存储器、图像传感器;所述中央处理器实现一个固件,用于处理所述数据处理系统的智能感知功能配置请求,根据所述请求内容,通过对所述通用通道接口控制器、所述张量处理器、所述图像信号处理器和所述图像传感器进行配置操作,实现所述智能感知图像获取装置的配置。本装置可以实现对图像数据所表达语义的理解,从而实现图像智能感知功能,且具有与传统图像传感器兼容的接口,可被所有具备传统图像获取装置连接能力的数据处理系统所使用,不破坏原有系统、兼容性高、使用方便。

    一种神经网络计算模块及人工智能处理系统

    公开(公告)号:CN112052944A

    公开(公告)日:2020-12-08

    申请号:CN202010813890.3

    申请日:2020-08-13

    IPC分类号: G06N3/063

    摘要: 本发明公开了一种神经网络计算模块及人工智能处理系统,该神经网络计算模块包括PE网络模块,PE网络模块包括若干PE计算单元,PE计算单元包括片上网络接口,片上网络接口与相邻的PE计算单元的片上网络接口通信连接。本发明采用片上网络与数据流结合的技术,按照纯计算的方式以最高的效率利用计算资源。