一种支持芯粒间多种互连拓扑的接口系统和通信方法

    公开(公告)号:CN119513000A

    公开(公告)日:2025-02-25

    申请号:CN202411501478.2

    申请日:2024-10-25

    Abstract: 本发明提供了一种支持芯粒间多种互连拓扑的接口系统和通信方法,接口系统包括仲裁模块,用于执行仲裁操作,得到仲裁信息,包括:根据对片间通道进行分组仲裁以适应当下的芯粒互连拓扑形式,进而得到分组仲裁结果,对片内待传输的信号做仲裁以指定子通道进行信号传输,得到传输组别仲裁结果,不同的分组子通道能用于连接同一其他芯粒或者多个不同的其他芯粒;配置模块,用于根据分组仲裁结果,对片间通道进行分组配置等配置操作;片间通道模块,用于通过片间通道传输信号,包括:根据传输组别仲裁结果中指定的子通道传输对应的数据包;本发明可让芯粒在每个方向上就可以与多芯粒进行互连,由此适应丰富的片间互联拓扑形式、提高片间通道的利用率。

    面向存内计算的卷积神经网络加速器架构的自动综合方法

    公开(公告)号:CN118133911A

    公开(公告)日:2024-06-04

    申请号:CN202410212878.5

    申请日:2024-02-27

    Abstract: 本发明提供了一种面向存内计算的卷积神经网络加速器的自动综合方法,该方法能够基于卷积神经网络推理任务、存内计算加速器峰值功耗约束、存内计算加速器的硬件参数查找表,采用模拟退火方法得到筛选出在每个参数组合下的卷积神经网络权重复制候选策略,采用遗传方法得到选出性能最优的宏单元映射方案从而获得该方案对应的卷积神经网络权重复制候选策略、存内计算加速器硬件参数组合以及硬件资源分配方案。采用本发明的方法来生成存内计算加速器架构配置的方案大大减少了架构设计的专业门槛,提高了存内计算加速器设计的效率,节省了专家设计的成本,同时有效丰富了加速器架构配置方案的优化策略以保障存内加速器配置方案的设计质量。

    基于芯粒互联接口的集成电路自动化设计方法及装置

    公开(公告)号:CN118133760A

    公开(公告)日:2024-06-04

    申请号:CN202410232643.2

    申请日:2024-02-29

    Abstract: 本发明提出一种芯粒互联接口自动化设计方法和装置,包括:获取芯粒系统的设计目标;根据该设计目标,调整芯粒互联接口的网表模板,生成符合该设计目标的设计网表;根据该设计网表中各功能模块的属性,区分该设计网表中数字电路部分与模拟电路部分;通过数字集成电路布局布线工具,生成该数字电路部分的数字电路版图;使用模拟集成电路布局布线自动工具,生成该模拟电路部分的模拟电路版图;通过设定芯粒互联接口,合并该数字电路版图与该模拟电路版图,得到该设计目标下的最终电路版图。本发明能够自动合并这些版图,生成一个完整、高效、准确的芯粒互联接口。

    芯片接口及其测试方法
    15.
    发明公开

    公开(公告)号:CN117827560A

    公开(公告)日:2024-04-05

    申请号:CN202311700750.5

    申请日:2023-12-12

    Abstract: 提供一种芯片接口及其测试方法,该芯片接口包括:输入端口,用于接收来自外部测试路径的伪随机二进制PRBS测试序列;测试序列对比模块,用于将所述输入端口接收的所述PRBS测试序列与所述测试序列对比模块中的标准序列进行对比,并输出比较结果;测试序列生成模块,用于生成PRBS测试序列;输出端口,用于将所述测试序列生成模块生成的PRBS测试序列输出至外部测试路径。

    一种多视觉任务加速器和多视觉任务处理的控制方法

    公开(公告)号:CN116089080A

    公开(公告)日:2023-05-09

    申请号:CN202310013486.1

    申请日:2023-01-05

    Abstract: 本发明提供了一种多视觉任务加速器和多视觉任务处理的控制方法,所述视觉任务是指利用卷积神经网络对输入的图像进行处理的任务,每个图像卷积神经网络包括至少一个卷积层,该加速器包括:用于执行卷积层的卷积运算的计算阵列;用于响应于一个或者多个视觉任务的加速计算请求,控制计算阵列执行一个视觉任务对应的卷积运算或者在计算阵列执行单个视觉任务对应的卷积运算存在空闲计算资源时将计算阵列分为至少两个区域以同时执行多个视觉任务中的至少两个视觉任务对应的卷积运算的控制器。

    一种构建自动驾驶决策系统的方法、系统和介质

    公开(公告)号:CN111985614B

    公开(公告)日:2023-03-24

    申请号:CN202010715409.7

    申请日:2020-07-23

    Abstract: 本发明实施例提供了一种构建自动驾驶决策系统的方法、系统和介质,所述自动驾驶决策系统包括强化学习模块和安全保障模块,所述安全保障模块包括基于规则的子模块和基于数据驱动的子模块,所述方法包括:A1、随机初始化强化学习模块和基于数据驱动的子模块的神经网络参数;A2、对自动驾驶决策系统依次进行第一学习阶段和第二学习阶段的训练;本发明无需大量的专家经验指导自动驾驶决策系统如何进行决策,节约了大量的训练成本,而且本发明的系统输出解析解作为经纠正的安全的动作向量,为驾驶的安全性提供了理论支撑,可以提高在实际应用中根据自动驾驶决策系统决策生成的动作向量进行自动驾驶的安全性。

    一种双调度模式的神经网络加速器

    公开(公告)号:CN115423083A

    公开(公告)日:2022-12-02

    申请号:CN202211126536.9

    申请日:2022-09-16

    Abstract: 一种双调度模式的神经网络加速器,所述加速器包括矩阵运算阵列、池化单元、激活单元,所述加速器还包括阵列切换模块、双调度缓存模块、辅助运算模块,其中:所述阵列切换模块用于控制矩阵运算阵列中子运算单元的之间的连接方式以实现矩阵运算阵列的阵列模式切换、控制双调度缓存模块缓存数据和传输数据的方式、以及控制辅助运算模块执行辅助运算;所述双调度缓存模块用于按照加速器对应的调度模式缓存从外部存储介质获取待处理的神经网络数据以及按照对应的调度模式将数据传输给矩阵运算阵列;所述辅助运算模块用于基于阵列切换控制模块的控制对矩阵运算阵列在串行阵列模式下执行运算后的结果进行加法计算。

    计算装置、处理器、电子设备和计算方法

    公开(公告)号:CN112132273B

    公开(公告)日:2022-11-29

    申请号:CN202010999529.4

    申请日:2020-09-22

    Abstract: 本发明提供了一种计算装置、处理器、电子设备和计算方法,其中,计算装置包括:逻辑运算单元、匹配单元和存储单元;所述匹配单元将接收的三值形式的计算元素匹配为二值形式的计算元素输出给所述逻辑运算单元;所述逻辑运算单元包括与或非门运算单元,所述与或非门运算单元对接收的二值形式的计算元素执行与或非逻辑运算,获得二值形式的计算结果,其中,所述计算元素包括特征值和对应的权重值;所述存储单元将完成运算的所述二值形式的计算结果转换为三值形式的计算结果并存储。本发明可以实现同时处理二值神经网络和三值神经网路。

    一种多计算精度神经网络处理方法和系统

    公开(公告)号:CN107423816B

    公开(公告)日:2021-10-12

    申请号:CN201710182542.9

    申请日:2017-03-24

    Abstract: 本发明涉及一种多计算精度神经网络处理方法与系统,该方法包括:步骤S1,从指令存储单元读取需要执行的指令,对该指令进行解析得到存储地址,并从该存储地址获取输入数据和权重;步骤S2,将该输入数据的位宽及该权重的位宽分别解码拓展为处理器设计最大数据位宽,生成原始数据和原始权重;步骤S3,分析该原始数据的位宽,关断计算单元阵列中的部分计算单元,并执行神经网络运算中的运算操作,生成计算数据;步骤S4,将该计算数据的位宽编码为神经网络下一层所需数据位宽,生成打包数据,并将该打包数据输出。本发明可使神经网络不同层采用不同的数据精度参与计算,在保证计算精度的前提下,减少了片上存储量,降低了数据传输能量损耗。

Patent Agency Ranking