用于线程的多个寄存器分配尺寸
    3.
    发明公开

    公开(公告)号:CN115525420A

    公开(公告)日:2022-12-27

    申请号:CN202210570979.0

    申请日:2022-05-24

    Abstract: 描述了为线程提供多个寄存器分配尺寸。系统的示例包括:一个或多个处理器,包括图形处理器,该图形处理器至少包括第一本地线程分派器(TDL)和多个处理资源,每个处理资源包括多个寄存器;以及存储器,用于存储数据以供处理,其中,一个或多个处理器用于:确定用于第一线程的寄存器尺寸;标识具有用于第一线程的足够的寄存器空间的一个或多个处理资源;选择一个或多个处理资源中具有足够的寄存器空间来指派第一线程的处理资源;为第一线程选择所选择的处理资源的可用的线程槽;以及为第一线程分派所选择的处理资源的寄存器。

    图形处理单元和用于其的方法
    4.
    发明公开

    公开(公告)号:CN115511692A

    公开(公告)日:2022-12-23

    申请号:CN202210638454.6

    申请日:2022-06-07

    Abstract: 实施例涉及用于重用FMA执行单元硬件逻辑以在GPU内为执行获得指数指令、获得尾数指令和/或缩放指令提供原生支持的系统和方法。这些新指令可用于通过检测和处置FMA执行单元的预处理级内的各种特殊情形输入来实现用于数学函数和分析函数(例如,超越函数)的无分支仿真算法,这允许对于此类特殊情形,FMA执行单元的主数据流被绕过。由于特殊情形由FMA执行单元处置,因此对各种函数(包括但不限于对数运算、指数运算和除法运算)进行仿真的库函数可以利用少得多的行数的机器级代码来实现,从而为HPC应用提供改善的性能。

    在计算架构中支持8位浮点格式操作数

    公开(公告)号:CN115129370A

    公开(公告)日:2022-09-30

    申请号:CN202210175439.2

    申请日:2022-02-24

    Abstract: 公开了一种用于促进在计算架构中支持8位浮点格式操作数的装置。该装置包括:处理器,该处理器包括:解码器,用于将取出以供执行的指令解码为经解码的指令,其中,经解码的指令是矩阵指令,矩阵指令对8位浮点操作数进行操作以使处理器执行并行点积操作;控制器,用于调度经解码的指令并且根据由经解码的指令指示的8位浮点数据格式来提供用于8位浮点操作数的输入数据;以及脉动点积电路,用于使用脉动层执行经解码的指令,每个脉动层包括一组或多组互连的乘法器、移位器和加法器,每组乘法器、移位器和加法器用于生成8位浮点操作数的点积。

    tanh和sigmoid函数执行
    7.
    发明公开

    公开(公告)号:CN114119338A

    公开(公告)日:2022-03-01

    申请号:CN202110843175.9

    申请日:2021-07-26

    Abstract: 本申请公开了tanh和sigmoid函数执行。本文中描述的示例关于用于请求执行tanh指令和sigmoid指令的指令。例如,编译器可生成原生tanh指令以执行tanh。在一些示例中,tanh函数可被编译为三条指令,包括:用于取决于输入的值而执行tanh(输入)或tanh(输入)/输入以生成中间输出的指令;用于基于输入而引起执行比例因子的生成的指令;以及用于引起执行对中间结果与比例因子的乘法操作的指令。例如,可编译sigmoid函数以使数学流水线执行范围校验并基于范围来执行操作。

    在图形环境中的数学管线阶段期间对整数管线去阻塞

    公开(公告)号:CN119579390A

    公开(公告)日:2025-03-07

    申请号:CN202411076182.0

    申请日:2024-08-07

    Abstract: 本公开的发明名称是“在图形环境中的数学管线阶段期间对整数管线去阻塞”。公开了一种用于促进在图形环境中的数学管线阶段期间对整数管线去阻塞的设备。所述设备包含执行资源,其包括:线程仲裁器;多个执行管线硬件电路模块,其包括用于共享线程仲裁器的资源的数学执行管线和整数执行管线;仲裁硬件电路模块,其用于确定数学执行管线是否可用于加载数学指令的数学操作对象数据;以及数学指令暂存缓冲器,其用于响应于数学执行管线不可用而存储数学操作对象数据;其中,整数执行管线要接收整数指令的整数操作对象数据,同时绕过数学指令暂存缓冲器中的数学操作对象数据;以及其中,数学执行管线要响应于数学执行管线变得可用而从数学指令暂存缓冲器接收数学操作对象数据。

    在计算架构中支持8位浮点格式操作数

    公开(公告)号:CN119356735A

    公开(公告)日:2025-01-24

    申请号:CN202411392808.9

    申请日:2022-02-24

    Abstract: 公开了一种用于促进在计算架构中支持8位浮点格式操作数的装置。该装置包括:处理器,该处理器包括:解码器,用于将取出以供执行的指令解码为经解码的指令,其中,经解码的指令是矩阵指令,矩阵指令对8位浮点操作数进行操作以使处理器执行并行点积操作;控制器,用于调度经解码的指令并且根据由经解码的指令指示的8位浮点数据格式来提供用于8位浮点操作数的输入数据;以及脉动点积电路,用于使用脉动层执行经解码的指令,每个脉动层包括一组或多组互连的乘法器、移位器和加法器,每组乘法器、移位器和加法器用于生成8位浮点操作数的点积。

Patent Agency Ranking