-
公开(公告)号:CN104572029A
公开(公告)日:2015-04-29
申请号:CN201410836240.5
申请日:2014-12-26
Applicant: 中国科学院自动化研究所
CPC classification number: G06F9/38
Abstract: 本发明公开了一种状态机拼接规则判定方法,以及基于该方法的状态机判定装置。本方法均以状态块为判定对象,对于两个或多个状态块,判断它们是否具有可拼接性,以及拼接生成的复合状态块的类型,生成复合状态块的类型包括含有嵌套循环块的全循环块类型、非全顺序块类型、全顺序块类型、全循环块类型和全嵌套循环块类型。本发明的方法能够保证状态机拼接过程正确和高效地进行,本发明的装置作为合并状态机的重要子装置,更加方便拼接装置的调试和修改,以及功能的移植和增加。
-
公开(公告)号:CN102591796B
公开(公告)日:2014-09-17
申请号:CN201110459917.4
申请日:2011-12-31
Applicant: 中国科学院自动化研究所
IPC: G06F12/06
Abstract: 本发明公开了一种并行位反序装置及方法,其中所述并行位反序装置包括并行位反序单元(314)、蝶形计算与控制单元(309)和存储器(311),所述蝶形计算与控制单元(309)通过数据总线(310)与所述存储器(311)相连,所述并行位反序单元(314)用于对所述蝶形计算与控制单元(309)所计算的蝶形组数据进行位反序。所述并行位反序单元(314)包括地址反序逻辑(306),地址反序逻辑(306)与蝶形计算与控制单元(309)相连,用于对来自蝶形计算与控制单元(309)读取地址进行镜像反序和右移操作。
-
公开(公告)号:CN102541749B
公开(公告)日:2014-09-17
申请号:CN201110459453.7
申请日:2011-12-31
Applicant: 中国科学院自动化研究所
IPC: G06F12/02
Abstract: 本发明公开了一种多粒度并行存储系统,该存储系统包括多个存储器、移位产生器、地址增量查找单元、地址移位器、行地址产生器和多个地址加法器。所述移位产生器用于根据外部输入的地址产生移位值Shift;所述地址增量查找单元用于根据读写粒度产生地址移位器的输入数据;地址移位器用于将输入的数据循环右移Shift个元素后输出到所述地址加法器一个输入端;所述行地址产生器用于根据外部输入的地址产生行地址,输入到每个地址加法器的另一个输入端;所述地址加法器用于将所述两个输入端输入的数据进行无符号相加,得到每个存储器的读写地址,并将其输入到所述多个存储器的地址输入端。本发明提出的存储系统可同时支持不同数据类型的矩阵行列数据并行读取,从而在根本上清除信号处理算法中转置操作的要求,提高信号处理算法执行效率。
-
公开(公告)号:CN102520903B
公开(公告)日:2014-07-23
申请号:CN201110415155.8
申请日:2011-12-13
Applicant: 中国科学院自动化研究所
IPC: G06F7/02
Abstract: 本发明公开了一种支持定浮点可重构的长度可配置的向量最大/最小值网络,包括:并行浮点数据预处理单元,用于对接收的512位向量数据A的格式进行分析,并针对不同的数据格式分别进行处理,将处理后得到的浮点数据输出给可重构比较器网络,将处理后得到的各种标志位输出给结果选择单元;Mask寄存器,用于控制参与最大/最小值的数据;可重构比较器网络,用于将接收自并行浮点数据预处理单元的浮点数据以及接收自Mask寄存器的值作为输入,对向量数据依次进行比较,将得到的最大/值结果输出给结果选择单元;以及结果选择单元,用于接收可重构比较器网络的输出,根据接收自并行浮点数据预处理单元的各种标志位输出得到最终的向量最大/最小值结果。
-
公开(公告)号:CN103236903A
公开(公告)日:2013-08-07
申请号:CN201310138909.9
申请日:2013-04-19
Applicant: 中国科学院自动化研究所
IPC: H04L1/00
Abstract: 本发明提出了一种改变数据序列顺序的装置,其包括:输入单元,其用于接收指令操作码和输入操作数;译码控制部件,其用于根据指令操作码和输入操作数产生译码控制信号;硬件索引更新部件,其用于在硬件自动索引时,产生硬件索引操作数;索引操作数单元,其用于根据译码控制部件产生的译码控制信号选择硬件索引操作数或者用户输入的索引操作数作为索引操作数,并输出至交织网络部件;交织网络部件,其用于根据所述索引操作数执行改变输入操作数中源操作数序列顺序的操作。利用该装置可以对长向量数据中的各字节数据按照任意的顺序交织成新的向量数据;同时还对向量数据中的一个或多个字节数据进行复制和整体左串移,形成新的向量数据。
-
公开(公告)号:CN102541813A
公开(公告)日:2012-07-04
申请号:CN201110460520.7
申请日:2011-12-31
Applicant: 中国科学院自动化研究所
IPC: G06F17/14
Abstract: 本发明公开了一种多粒度并行FFT蝶形计算的方法及相应的装置。该方法及装置中的蝶形计算为非原址计算,每次从输入缓冲器和旋转因子缓冲器中读取蝶形计算所需的数据及旋转因子,之后用统一的蝶形表达式并行地进行多级蝶形计算,最后把计算结果写回到输出缓冲器。本发明最大限度地减少了访问缓冲器的次数,大大提高了蝶形计算的速度,并减少了功耗。本发明能高效、并行地执行多粒度、多数据格式的蝶形计算,还可以根据具体实现指明蝶形计算的并行粒度和数据格式,对平衡组和非平衡组的FFT蝶形计算均适用。
-
公开(公告)号:CN102411491A
公开(公告)日:2012-04-11
申请号:CN201110460582.8
申请日:2011-12-31
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种用于并行FFT计算的数据存取方法及装置。该方法将FFT计算数据和旋转因子存放在多粒度并行存储器中,并用统一的蝶形表达式对整个计算过程中的FFT数据和对应的旋转因子进行分组,每分组数据包含多个蝶形,可并行计算;同时根据该蝶形表达式,可方便生成各个分组的数据地址和旋转因子系数地址,利用不同的读写粒度,可从多粒度存储器中并行读写数据和对应的旋转因子。本发明还提供一种用于并行FFT计算的数据存取装置。利用本发明,数据的读写过程中不会产生存储器冲突,也不需要额外的步骤再对读写数据进行排序,同时,本发明可根据具体实现灵活指定并行粒度。
-
公开(公告)号:CN101847087B
公开(公告)日:2012-03-28
申请号:CN201010162375.X
申请日:2010-04-28
Applicant: 中国科学院自动化研究所
IPC: G06F7/505
Abstract: 本发明公开了一种支持定浮点可重构的横向求和网络结构,包括依次连接的浮点指数操作部分、浮点尾数操作/定点操作部分、浮点规格化操作部分,其中:浮点指数操作部分,用于完成选择指数最大值以及求指数差,得到的指数差输出给浮点尾数操作/定点操作部分;浮点尾数操作/定点操作部分,用于完成浮点尾数的移位对齐、数据压缩、数据求和,以及对浮点结果的补码转换,同时通过另一旁路并行完成对浮点规格化操作中需要的前导0预测判断,得到的处理结果输出给浮点规格化操作部分;浮点规格化操作部分,用于完成浮点尾数的规格化移位和调整指数。利用本发明,降低了多输入浮点加法的关键通路延时,减少了定点求和所消耗的运算资源,并降低了功耗。
-
公开(公告)号:CN106371805B
公开(公告)日:2018-07-17
申请号:CN201610685174.5
申请日:2016-08-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种处理器的动态调度互联寄存器及利用该动态调度互联寄存器调度数据的方法。其中,动态调度互联寄存器至少包括:至少一功能单元和至少一物理寄存器;其中,所述至少一功能单元的输出端口和所述动态调度互联寄存器的输入端口只绑定有一所述物理寄存器。本发明实施例通过功能单元的寄存器动态调度设计将复杂的互联网络简化。将原本的功能单元间复杂的数据选择,转移到属于同一个功能单元的寄存器之间的数据调度。这样,可以使功能单元间的互联网络变得精简,化长连线的数据选择为短距离的寄存器间数据调度,可以很大程度上的降低互联网络上的功耗,同时不影响运算器的功能和性能。
-
公开(公告)号:CN106371805A
公开(公告)日:2017-02-01
申请号:CN201610685174.5
申请日:2016-08-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种处理器的动态调度互联寄存器及利用该动态调度互联寄存器调度数据的方法。其中,动态调度互联寄存器至少包括:至少一功能单元和至少一物理寄存器;其中,所述至少一功能单元的输出端口和所述动态调度互联寄存器的输入端口只绑定有一所述物理寄存器。本发明实施例通过功能单元的寄存器动态调度设计将复杂的互联网络简化。将原本的功能单元间复杂的数据选择,转移到属于同一个功能单元的寄存器之间的数据调度。这样,可以使功能单元间的互联网络变得精简,化长连线的数据选择为短距离的寄存器间数据调度,可以很大程度上的降低互联网络上的功耗,同时不影响运算器的功能和性能。
-
-
-
-
-
-
-
-
-