-
公开(公告)号:CN116204232A
公开(公告)日:2023-06-02
申请号:CN202211739806.3
申请日:2022-12-30
申请人: 上海芯联芯智能科技有限公司
摘要: 本申请实施例提供了一种数据操作位宽的扩展方法及装置,涉及计算机技术领域,包括:读取矢量宽度控制寄存器中的可变矢量信息,基于可变矢量信息确定扩展后的最大数据操作位宽。若待处理数据的宽度大于原始数据操作位宽,且小于等于最大数据操作位宽,则基于待处理数据的宽度和单个运算单元的位宽,确定用于处理待处理数据的运算单元的目标个数。将目标个数减一后写入运算单元控制寄存器,以控制启动目标个数的运算单元,对待处理数据进行处理。利用新定义两个控制寄存器实现在未改变原有模式的前提下进行可变矢量扩展,从原始数据操作位宽扩展到更大的数据操作位宽,在不需要指令集扩展以及代码重写的情况下,提高了数据处理的并行化能力。
-
公开(公告)号:CN114721721A
公开(公告)日:2022-07-08
申请号:CN202210215079.4
申请日:2011-12-23
申请人: 英特尔公司
发明人: R·凡伦天 , E·乌尔德-阿迈德-瓦尔 , J·考博尔 , T·尤里尔 , B·L·托尔
摘要: 本申请描述用于混洗浮点或整数值的装置和方法,尤其描述了用于将来自源寄存器的数据元素混洗到目的地寄存器的装置和方法。例如,根据一个实施例的方法包括以下操作:读取存储在掩码数据结构中的每个掩码位,所述掩码数据结构包括和目的地寄存器的数据元素相关联的掩码位,其值可用于确定应在存储于第一源寄存器和第二源寄存器中的数据元素上执行掩码操作还是混洗操作;对于目的地寄存器的每个数据元素,如果和该数据元素关联的掩码位指示应执行混洗操作,则将来自第一源寄存器和第二源寄存器的数据元素混洗至目的地寄存器中的指定数据元素;且如果掩码位指示应执行掩码操作,则执行针对所述目的地寄存器的数据元素的指定掩码操作。
-
公开(公告)号:CN113626076A
公开(公告)日:2021-11-09
申请号:CN202010383677.3
申请日:2020-05-08
申请人: 安徽寒武纪信息科技有限公司
发明人: 不公告发明人
摘要: 本公开涉及一种数据处理方法及装置以及相关产品。所述产品包括控制模块,所述控制模块包括:指令缓存单元、指令处理单元和存储队列单元;所述指令缓存单元,用于存储所述人工神经网络运算关联的计算指令;所述指令处理单元,用于对所述计算指令解析得到多个运算指令;所述存储队列单元,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。通过以上方法,本公开可以提高相关产品在进行神经网络模型的运算时的运算效率。
-
公开(公告)号:CN112394998A
公开(公告)日:2021-02-23
申请号:CN201910744396.3
申请日:2019-08-13
申请人: 上海寒武纪信息科技有限公司
发明人: 不公告发明人
摘要: 本公开涉及一种运算方法、装置及相关产品。机器学习装置包括一个或多个指令处理装置,用于从其他处理装置中获取待执行数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;当机器学习运算装置包含多个指令处理装置时,多个指令处理装置间可以通过特定的结构进行连接并传输数据。其中,多个指令处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据;多个指令处理装置共享同一控制系统或拥有各自的控制系统、且共享内存或者拥有各自的内存;多个指令处理装置的互联方式是任意互联拓扑。本公开实施例所提供的运算方法、装置及相关产品的适用范围广,对写数指令的处理效率高、处理速度快。
-
公开(公告)号:CN107003856B
公开(公告)日:2020-05-29
申请号:CN201580068481.2
申请日:2015-12-16
申请人: 德克萨斯仪器股份有限公司
发明人: S·贾兰 , R·C·亚拉杜亚特纳哈利
摘要: 在所述示例中,寄存器写入机构(400)不需要读取寄存器中的数据。根据各方面,每个寄存器(204,206,208,210,434,436)用掩码组件(402)提供的掩码位进行掩码。在第一实施方式中,使用位寄存器的后半部分中的数据对位寄存器的前半部分进行掩码。在第二实施方式中,使用由掩码组件生成的掩码字来掩码所有的位寄存器。
-
公开(公告)号:CN110533414A
公开(公告)日:2019-12-03
申请号:CN201910805540.X
申请日:2019-08-29
申请人: 金邦达有限公司
摘要: 本发明提供一种交通IC卡交易中进制转换的方法、计算机装置及计算机可读存储介质,包括对数据进行初始化操作;将待转换数组的数据的最低半字节对应查找第一映射列表并执行相关操作得到第一映射数组;执行判断操作,判断循环移位计数器是否已达到最大值,如是,则通过对应查找第二映射列表并执行相关操作得到各元素的映射数值,传递给转换结果数组;如否,则待转换数组的数据向高半个字节的位置方向偏移,对应查找第一映射列表、通过相关操作得到更新映射数组,并返回执行判断操作。本发明还提供实现上述方法的计算机装置及计算机可读存储介质。本发明采用列表映射法进行十六进制向十进制的转换,可更大程度地减少计算,提升转换效率及交易速度。
-
公开(公告)号:CN106796504B
公开(公告)日:2019-08-13
申请号:CN201580051186.6
申请日:2015-07-27
申请人: 线性代数技术有限公司
摘要: 公开了一种包括各种可变长度指令的向量处理器。公开了用于以省时、存储器高效且功率高效的方式有效地执行各种操作的计算机实现的方法。公开了用于通过基于延迟线指令的长度而控制阈值来更有效地管理缓冲器的方法。公开了用于在硬件中布置多类型和多尺寸操作的方法。公开了用于压缩查找表的方法。公开了用于对变量进行在线改变的方法。
-
公开(公告)号:CN106796504A
公开(公告)日:2017-05-31
申请号:CN201580051186.6
申请日:2015-07-27
申请人: 线性代数技术有限公司
摘要: 公开了一种包括各种可变长度指令的向量处理器。公开了用于以省时、存储器高效且功率高效的方式有效地执行各种操作的计算机实现的方法。公开了用于通过基于延迟线指令的长度而控制阈值来更有效地管理缓冲器的方法。公开了用于在硬件中布置多类型和多尺寸操作的方法。公开了用于压缩查找表的方法。公开了用于对变量进行在线改变的方法。
-
公开(公告)号:CN106779057A
公开(公告)日:2017-05-31
申请号:CN201611001971.3
申请日:2016-11-11
申请人: 北京旷视科技有限公司 , 北京小孔科技有限公司
发明人: 魏铭
摘要: 本发明实施例提供了一种基于GPU的计算二值神经网络卷积的处理方法,包括:获取根据二值神经网络执行卷积操作的计算请求;根据所述计算请求,开启GPU上的至少一个线程块,其中,每个线程块包括多个线程;基于两级分块策略,确定所述至少一个线程块中每个线程块的计算区域范围,并确定每个线程块所包括的线程的计算区域范围;所述至少一个线程块中的每个线程块内的各个线程执行计算过程,得到计算结果;根据每个线程块内的各个线程得到的所述计算结果,确定相应的线程块的输出结果。本发明设计了基于GPU线程块的两级分块策略,充分利用了GPU的访存特性,从而能够在GPU设备上实现二值神经网络卷积计算,并且计算速度得到了提升,内存消耗得到了减少。
-
公开(公告)号:CN101937333B
公开(公告)日:2014-12-10
申请号:CN201010277155.1
申请日:2010-09-07
申请人: 威盛电子股份有限公司
摘要: 判断系统及方法。该系统利用一共用加法器电路,执行一水平最小指令及一误差绝对值总和指令中的一个,并包括多个加法器、一加总电路、一比较电路以及一路径选择电路。路径选择电路根据所执行的指令,将多个数字码传送至加法器中。在执行水平最小指令时,这些加法器会被分类成许多加法器对。每一加法器对提供一进位输出及一传递输出。每一加法器对具有一高加法器以及一低加法器。高加法器比较这些数字码的一数字码对的高部分。低加法器比较这些数字码的该数字码对的低部分。根据这些进位输出及这些传递输出,找出最小的数字码。
-
-
-
-
-
-
-
-
-