一种超长点数高性能FFT计算装置

    公开(公告)号:CN112163187B

    公开(公告)日:2023-07-07

    申请号:CN202011290004.X

    申请日:2020-11-18

    Abstract: 本发明涉及数字信号处理领域,具体涉及一种超长点数超高性能FFT计算装置。本发明通过以下技术方案得以实现的:一种超长点数超高性能FFT计算装置,包含FFT计算模块和控制单元,所述FFT计算模块数量为两个,分别为计算模块一和计算模块二;还包含两个三维转置存储器和二维转置存储器;三维转置存储器一的数据输入端连接主存,数据输出端连接计算模块一;所述二维转置存储器的数据输入端连接所述计算模块一,数据输出端连接所述计算模块二。本发明的目的是提供一种超长点数超高性能FFT计算装置,通过全新的数据转置处理方式,增加数据平滑性,使得FFT数据处理过程中数据带宽利用率高,大大增加处理效率。

    一种支持分区并发访问的软硬件协同存储器组织方法及装置

    公开(公告)号:CN115357195A

    公开(公告)日:2022-11-18

    申请号:CN202211059381.1

    申请日:2022-08-31

    Abstract: 本发明提供一种支持分区并发访问的软硬件协同存储器组织方法及装置方法及装置,属于存储器设计技术领域。该方法包括如下步骤:S1:将存储器基于预设区分方式从逻辑上划分为地址连续的多个可独立访问的存储体;S2:获取来自多个计算单元/请求源发送的多个请求信息,基于请求信息和逻辑划分模式匹配对应的存储体,将每个请求信息分别发送至对应的存储体;S3:接收对应的计算单元/请求源的请求信息,基于请求信息和逻辑划分模式获取该计算单元/请求源相匹配的存储体,将该存储体的访存请求数据发送至对应的计算单元/请求源。本发明只需配备开销较小的存储访问模块和数据选择模块即可实现高并行度的访问处理,设计复杂度低,实现开销小。

    一种基于动态信用的零级指令循环缓冲预取方法及装置

    公开(公告)号:CN110727463B

    公开(公告)日:2021-08-10

    申请号:CN201910863815.5

    申请日:2019-09-12

    Abstract: 本发明公开了一种基于动态信用的零级指令循环缓冲预取方法。包括当检测到指令流中存在循环体时,判断循环体的循环方向;根据循环体的循环方向确定循环体的循环出口指令信息,并根据循环出口指令信息向一级指令缓存控制部件发送预取信用信息;当检测到输出指令到达循环体尾部时,判断循环体的行进方向,若循环体的行进方向为继续循环方向,则向一级指令缓存控制部件的预取信用管理部件发送启动预取信号。本发明还公开了一种基于动态信用的零级指令循环缓冲预取装置。本发明通过预取循环出口方向的指令,可以在零级指令循环缓存中的循环退出时,立即从零级指令缓存中继续提供出口方向的指令,避免零级指令缓存脱靶时带来的性能气泡。

    一种处理器阵列局部存储混合管理方法

    公开(公告)号:CN110704362B

    公开(公告)日:2021-03-12

    申请号:CN201910864444.2

    申请日:2019-09-12

    Abstract: 本发明提供一种处理器阵列局部存储混合管理技术,属于计算机体系结构和处理器微结构技术领域。该处理器阵列局部存储混合管理技术包括如下步骤:S1:将阵列处理器中每个核心的片上局部存储(LDM)被划分为第一类区域、第二类区域和第三类区域;S2:将第一类区域设定为用以保存本地私有数据、其具体编址仅对本核心的应用程序可见的私有存储空间;S3:将第二类区域设定为用以保存多个核心的共享数据、其具体编址对多个核心的应用程序可见的共享存储空间;S4:将第三类区域设定为用以映射到整个主存空间、采用Cache的方式管理以使本核心的应用程序对可Cache空间的访问可见的Cache存储空间。本发明针对应用特征进行灵活配置,高效发挥应用的实际运行性能。

    一种面向大数据的加速排序装置、方法、芯片、处理器

    公开(公告)号:CN106250097A

    公开(公告)日:2016-12-21

    申请号:CN201610460936.1

    申请日:2016-06-22

    CPC classification number: G06F7/24

    Abstract: 本发明提出一种面向大数据的加速排序装置、方法、芯片、处理器,涉及处理器设计领域,该方法对待排序列数据,每次取连续n位数据,取m组,并存放在所述寄存器组中;分别对m组所述待排序列数据进行排序,生成m组有序序列数据,通过排序算法将所述有序序列数据进行排序。本发明将所有与比较相关的排序算法复杂度降为原来的1/n;同时,这种n单元数据的连续访存,一定程度降低了访存开销,从而大大的提高了排序算法的执行速度,通过本发明,提高了单个节点处理器上针对排序应用的处理效率。

    部件模型间通信的模拟及路由方法、并行事务级模拟系统

    公开(公告)号:CN102761473A

    公开(公告)日:2012-10-31

    申请号:CN201110110822.1

    申请日:2011-04-29

    Abstract: 一种建立部件模型间通信的模拟方法,包括:将所述部件模型以矩阵形式分布,确定所述矩阵的维数;根据所述部件模型的类型,将所述矩阵分成子矩阵,基于所述矩阵的维数及所述子矩阵在所述矩阵中的位置生成分布表达式;基于所述部件模型在所述矩阵中的位置坐标和待模拟的部件模型间的连接关系生成连接关系表达式;检查所述分布表达式和连接关系表达式的逻辑是否正确,若正确则基于所述连接关系表达式,生成并行事务级模拟系统的描述文件。本发明公开的技术方案提高了并行事务级模拟系统的开发效率,降低了维护部件模型和并行事务级模拟系统的开销。

    读-修改-写处理系统及方法

    公开(公告)号:CN101989241A

    公开(公告)日:2011-03-23

    申请号:CN200910165363.X

    申请日:2009-08-07

    Abstract: 一种读-修改-写处理系统及方法。所述读-修改-写处理系统通过子命令生成单元,使得任一时刻读-修改-写处理系统可以并行处理多个“读-修改-写”命令。以同类型命令优先通过的方式对所获得的内存操作命令进行仲裁,使得同一类型的命令可以得到优先通过,并随即处理。所述读-修改-写处理系统及方法可以避开“对于同一激活行的读写访问之间存在的时间间隔较大”这一问题对访存性能的影响,并可以减少数据总线的读写方向切换次数,从而提高了访存带宽。

Patent Agency Ranking