用于广播算术操作的系统、装置和方法

    公开(公告)号:CN108268279B

    公开(公告)日:2024-05-03

    申请号:CN201810002342.5

    申请日:2018-01-02

    申请人: 英特尔公司

    IPC分类号: G06F9/30

    摘要: 本申请公开了用于广播算术操作的系统、装置和方法。用于指令执行的系统、装置和方法的实施例。在一些实施例中,指令具有用于第一和第二源操作数、和目的地操作数的字段。当被执行时,指令引起对第一源操作数的被广播的紧缩数据元素的算术操作并且将每个算术操作的结果存储在目的地操作数中,其中第一源操作数的要被广播的紧缩数据元素由存储在第二源操作数中的紧缩数据元素的值指定,其中算术操作由指令定义。

    用于将四字移位并提取紧缩字的装置和方法

    公开(公告)号:CN109582359A

    公开(公告)日:2019-04-05

    申请号:CN201811115434.0

    申请日:2018-09-25

    申请人: 英特尔公司

    IPC分类号: G06F9/30

    摘要: 公开了用于将紧缩数据元素移位并提取紧缩数据元素的装置和方法。用于对紧缩四字数据执行左移操作的装置和方法。例如,处理器的一个实施例包括:解码器,用于对左移指令解码以生成经解码的左移指令;第一源寄存器,用于存储多个紧缩四字数据元素;执行电路,用于执行经解码的左移指令,该执行电路包括移位电路,该移位电路用于将分别来自第一源寄存器中的第一和第二紧缩四字数据元素位置的至少第一和第二紧缩四字数据元素左移在立即数值中或在第二源寄存器中的控制值中指定的量,以生成第一和第二左移的四字;执行电路用于引起选择第一和第二左移的四字的16个最高有效的位用于分别被写入到目的地寄存器的第一和第二四字元素位置的16个最低有效的位的区域;并且所述目的地寄存器用于存储第一和第二左移的四字的16个最高有效的位的指定集合。

    用于具有数据流执行电路的可配置加速器的装置、方法和系统

    公开(公告)号:CN114327620A

    公开(公告)日:2022-04-12

    申请号:CN202110997179.2

    申请日:2021-08-27

    申请人: 英特尔公司

    IPC分类号: G06F9/22 G06F9/28

    摘要: 描述了关于具有数据流执行电路的可配置加速器的系统、方法和装置。在一个实施例中,硬件加速器包括多个数据流执行电路、交叉依赖性网络和存储器执行接口,每个数据流执行电路都包括:寄存器堆、多个执行电路、以及图站电路,图站电路包括多个数据流操作条目,每个数据流操作条目都包括指示用于数据流操作的输入操作数何时在寄存器堆中可用的相应“就绪”字段,并且图站电路用于:当第一数据流条目的操作数可用时,选择该第一数据流操作条目用于执行;以及当执行的结果被存储在寄存器堆中时,清除第一数据流操作条目中的输入操作数的“就绪”字段;交叉依赖性网络耦合在多个数据流执行电路之间,用于根据第二数据流操作条目在多个数据流执行电路之间发送数据;存储器执行接口耦合在多个数据流执行电路与高速缓存区块之间,用于根据第三数据流操作条目在多个数据流执行电路与高速缓存区块之间发送数据。

    处置半精度操作数的系统、方法和装置

    公开(公告)号:CN109840070A

    公开(公告)日:2019-06-04

    申请号:CN201811284253.0

    申请日:2018-10-31

    申请人: 英特尔公司

    IPC分类号: G06F7/57

    摘要: 本申请公开了处置半精度操作数的系统、方法和装置。本文中详述的实现方式包括但不限于一种装置,该装置具有指令执行电路和寄存器,该指令执行电路用于执行经解码的指令,该经解码的指令具有利用半精度浮点数据的至少一个操作数,该寄存器用于存储与利用半精度浮点数据的至少一个操作数有关的控制信息,其中该控制信息用于指定指令的执行的下溢操作何时将被转储清除为零以及指令的非正规输入何时将被归零。