一种GPU中用于分支处理的寄存器文件结构

    公开(公告)号:CN106648545A

    公开(公告)日:2017-05-10

    申请号:CN201610030501.3

    申请日:2016-01-18

    Applicant: 天津大学

    Inventor: 魏继增

    CPC classification number: G06F9/30141 G06F9/30105 G06F9/30178 G06T1/20

    Abstract: 本发明公开了一种GPU中用于分支处理的寄存器文件结构,该寄存器文件结构中,把寄存器文件按照行平均分成N个bank,N是GPU中一个SM所能容纳的最多的线程束的个数;对于寄存器文件中寄存器的分配方法遵循以下约束条件:(1)当应用程序中的每一个线程束所需要的寄存器的个数大于或等于每个bank中所包括的行数时,将寄存器文件中的寄存器连续地平均分配给每一个线程束;(2)当应用程序中的每一个线程束所需要的寄存器的个数小于每个bank中所包括的行数时,此时每一个线程束独占一个bank。与现有技术相比,本发明对GPU架构进行修改后,硬件利用率最高能提升3.1倍,平均(OA)的硬件利用率由62.7%提高到85.9%。而性能最高能够提升2.3倍,平均(HM)能够提升8.4%。

    转置指令
    86.
    发明公开

    公开(公告)号:CN104011672A

    公开(公告)日:2014-08-27

    申请号:CN201180075978.9

    申请日:2011-12-30

    Inventor: A·杰哈

    Abstract: 描述了转置指令。取出转置指令,其中转置指令包括指定向量寄存器或存储器位置的操作数。解码该转置指令。执行经解码的转置指令,使得所指定的向量寄存器或存储器位置中的每个数据元素以相反的顺序被存储在该指定的向量寄存器或存储器位置中。

    硬件协议栈
    88.
    发明公开

    公开(公告)号:CN103336757A

    公开(公告)日:2013-10-02

    申请号:CN201310084123.3

    申请日:2013-03-15

    Inventor: 李寿康 权大贤

    CPC classification number: G06F9/30105 H04L69/12 H04L69/22

    Abstract: 本发明公开了一种硬件协议栈,其中,分析对象协议的帧头信息存储在寄存器单元中,比较记录在输入帧的帧头中的信息与存储在寄存器单元中的帧头信息是否相互匹配,且作为比较的结果,提取数据。

Patent Agency Ranking