一种大点数FFT在处理器上的实现方法

    公开(公告)号:CN103106181A

    公开(公告)日:2013-05-15

    申请号:CN201310034812.3

    申请日:2013-01-29

    Abstract: 本发明公开了一种大点数FFT在处理器上的实现方法,能够解决传统FFT算法在处理器上实现大点数快FFT时没有充分考虑Cache丢失对执行效率影响的问题,改进了传统Winograd算法处理速度有限的问题。该方法包括:将一维序列存储为二维矩阵;处理器先列FFT:每次从二维矩阵中读取i列数据,读取的i列数据分次处理,则处理器共读取并处理次;其中,在保证列长度的基础上,使行长度M小于或等于处理器所用Cache的容量;处理器再进行行FFT,一次一行,且采用新的旋转因子,并将结果按照列方向输出。

    基于分布式存储器的数据存储方法

    公开(公告)号:CN101782878B

    公开(公告)日:2011-11-16

    申请号:CN200910081417.4

    申请日:2009-04-03

    Abstract: 本发明公开了一种基于分布式存储器的数据存储方法,第一步:将完整数据矩阵按照某一维划分为n段,其中n为实际系统处理的节点数;第二步:根据数据划分方式,产生数据分布图;记录第一步中划分好的数据段位于哪一节点内;第三步:对单节点内的数据矩阵划分;根据SDRAM的页大小,将每个处理节点内的大矩阵划分为若干小矩阵;第四步:接收矩阵访问命令,根据收到的命令判断访问矩阵哪一维;第五步:返回数据,进行处理。发明为了平衡数据矩阵的行向量和列向量的操作效率,改变传统的存储数据方式,使得在SDRAM的一行中即包含数据矩阵的行向量数据,还要包含一部分列向量数据,这样便可以做到两维操作均衡。

    基于分布式存储器的数据存储方法

    公开(公告)号:CN101782878A

    公开(公告)日:2010-07-21

    申请号:CN200910081417.4

    申请日:2009-04-03

    Abstract: 本发明公开了一种基于分布式存储器的数据存储方法,第一步:将完整数据矩阵按照某一维划分为n段,其中n为实际系统处理的节点数;第二步:根据数据划分方式,产生数据分布图;记录第一步中划分好的数据段位于哪一节点内;第三步:对单节点内的数据矩阵划分;根据SDRAM的页大小,将每个处理节点内的大矩阵划分为若干小矩阵;第四步:接收矩阵访问命令,根据收到的命令判断访问矩阵哪一维;第五步:返回数据,进行处理。本发明为了平衡数据矩阵的行向量和列向量的操作效率,改变传统的存储数据方式,使得在SDRAM的一行中既包含数据矩阵的行向量数据,还要包含一部分列向量数据,这样便可以做到两维操作均衡。

    一种大点数FFT在处理器上的实现方法

    公开(公告)号:CN103106181B

    公开(公告)日:2016-03-02

    申请号:CN201310034812.3

    申请日:2013-01-29

    Abstract: 本发明公开了一种大点数FFT在处理器上的实现方法,能够解决传统FFT算法在处理器上实现大点数快FFT时没有充分考虑Cache丢失对执行效率影响的问题,改进了传统Winograd算法处理速度有限的问题。该方法包括:将一维序列存储为二维矩阵;处理器先列FFT:每次从二维矩阵中读取i列数据,读取的i列数据分次处理,则处理器共读取并处理次;其中,在保证列长度的基础上,使行长度M小于或等于处理器所用Cache的容量;处理器再进行行FFT,一次一行,且采用新的旋转因子,并将结果按照列方向输出。

Patent Agency Ranking