用于生成输入掩码张量的方法、计算设备和介质

    公开(公告)号:CN118567610B

    公开(公告)日:2024-11-08

    申请号:CN202411052381.8

    申请日:2024-08-01

    IPC分类号: G06F7/76

    摘要: 本发明的实施例涉及一种用于生成输入掩码张量的方法、计算设备、存储介质和计算机程序产品。该方法在设备端处执行,并且包括:至少基于输入张量,确定输入掩码张量的张量维度和用于填充输入掩码张量的数据;以及由设备端中的至少一个计算单元,基于输入掩码张量的张量维度和用于填充输入掩码张量的数据,生成输入掩码张量,其中,所生成的输入掩码张量中的数据为比特型数据。本发明的实施例能够在设备端处直接生成用于masked_fill函数的输入掩码张量,省略了主机端与设备端之间关于输入掩码张量的传输过程,节省时间。

    人工智能芯片、寄存器空间动态管理方法、介质和程序

    公开(公告)号:CN118626146B

    公开(公告)日:2024-10-29

    申请号:CN202411081222.0

    申请日:2024-08-08

    IPC分类号: G06F9/30

    摘要: 本发明提供一种人工智能芯片及其寄存器空间动态管理方法和机器可读存储介质、计算机程序产品。人工智能芯片包括指令高速缓存、寄存器电路以及执行电路。指令高速缓存用以存放线程束运行所需的指令。寄存器电路用以提供寄存器空间。执行电路耦接至指令高速缓存以及寄存器电路。执行电路从指令高速缓存取得且执行所述线程束。线程束包括第一子程序段,其中第一子程序段需要使用第一寄存器空间。执行电路在执行线程束的过程中要求寄存器电路从寄存器电路的寄存器空间中分派第一寄存器空间给第一子程序段使用。在第一子程序段执行完成后且在线程束执行完成前,执行电路要求寄存器电路实时释放第一寄存器空间。

    用于板卡间数据传输的方法、板卡、电子设备和存储介质

    公开(公告)号:CN118820170A

    公开(公告)日:2024-10-22

    申请号:CN202411310847.X

    申请日:2024-09-19

    摘要: 本发明的实施例涉及一种用于板卡间数据传输的方法、板卡、电子设备和存储介质。该方法包括:向第一板卡发送写指令;响应于接收到写指令,由第一板卡将预定数量的数据写入第二板卡;向第一板卡发送屏障指令,以阻挡第一板卡向第二板卡发送后续指令,直至确定预定数量的数据全部写入第二板卡;由第一板卡确定预定数量的数据是否全部写入第二板卡;以及响应于第一板卡确定预定数量的数据全部写入第二板卡,由第一板卡向第二板卡发送同步信号,以指示预定数量的数据已全部同步至第二板卡。本发明的实施例能够避免第二板卡对第一板卡进行远程轮询,提高数据传输的性能,并且能够确保数据同步的准确性。

    用于访问设备的基地址寄存器空间的方法、设备和介质

    公开(公告)号:CN118409982B

    公开(公告)日:2024-09-24

    申请号:CN202410813567.4

    申请日:2024-06-21

    IPC分类号: G06F12/1027 G06F12/02

    摘要: 本发明的实施例涉及一种用于访问设备的基地址寄存器空间的方法、计算设备和存储介质,包括:配置第一模板类,以用于封装设备的基地址寄存器空间地址的相关数据,其中第一模板类包括:第一成员变量,该第一成员变量的取值与设备的类型有关,和解引用运算符重载函数;响应于对基于第一模板类定义的对象进行解引用运算符运算,调用第一模板类中的解引用运算符重载函数,以至少基于第一成员变量和解引用运算符重载函数的返回值访问设备的基地址寄存器空间。本发明提供的访问设备的基地址寄存器空间的方法能够实现通过解引用运算符运算的方式访问可映射设备和不可映射设备两者的BAR空间,提高开发效率,并使代码易于维护。