数据访问的方法、装置、设备和存储介质

    公开(公告)号:CN111208933A

    公开(公告)日:2020-05-29

    申请号:CN201811391728.6

    申请日:2018-11-21

    发明人: 梁子豪 欧阳剑

    IPC分类号: G06F3/06

    摘要: 根据本公开的实施例,提供了一种用于数据访问方法、装置、设备和存储介质。该方法包括获取针对存储设备的第一访问请求和第二访问请求;将与第一访问请求相关联的第一数据从源设备中加载到预分配的缓冲区中,缓冲区具有与存储设备的单个物理存储块相同的大小;确定与第二访问请求相关联的第二数据的第一大小是否小于缓冲区的可用空间的第二大小;响应于确定第一大小不小于第二大小,确定第二数据中的第一部分,第一部分具有与可用空间相同的大小;以及向与第一访问请求和第二访问请求相关联的目标设备提供第一数据和第一部分。

    用于缩放图像的处理器和方法

    公开(公告)号:CN107680028B

    公开(公告)日:2020-04-21

    申请号:CN201610621655.X

    申请日:2016-08-01

    IPC分类号: G06T1/20 G06T1/60

    摘要: 本申请公开了用于缩放图像的处理器和方法。所述处理器的一具体实施方式包括:包括片外存储器、通信器件、控制器件以及阵列处理机,其中:所述片外存储器,用于存储待缩放的原始图像;所述通信器件,用于接收图像缩放指令;所述控制器件,用于执行所述图像缩放指令,向所述阵列处理机发出计算控制信号;所述阵列处理机,用于在所述计算控制信号的控制下,使用所述阵列处理机中的N个处理单元根据所述宽度缩放倍数、所述高度缩放倍数以及所提取像素数据中N个通道的通道值,并行计算目标像素中N个通道的通道值。该实施方式提高了图像缩放操作的处理速度。

    用于处理数据序列的方法和装置

    公开(公告)号:CN106529669A

    公开(公告)日:2017-03-22

    申请号:CN201610990113.X

    申请日:2016-11-10

    IPC分类号: G06N3/06

    CPC分类号: G06N3/0445 G06N3/063

    摘要: 本申请公开了用于处理数据序列的方法和装置。该方法的一具体实施方式包括:接收输入的待处理数据序列;将循环神经网络模型中的权重矩阵复制到现场可编程逻辑门阵列FPGA的嵌入式块随机存取存储器RAM中;利用循环神经网络模型中的激活函数和嵌入式块RAM中存储的权重矩阵依次对待处理数据序列中的各待处理数据进行处理;输出与待处理数据序列对应的处理后的数据序列。该实施方式提高了循环神经网络模型处理数据序列的效率。

    浮点数矩阵的处理方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN108628807B

    公开(公告)日:2022-11-25

    申请号:CN201710165155.4

    申请日:2017-03-20

    IPC分类号: G06F17/16

    摘要: 本发明提供一种浮点数矩阵的处理方法、装置、设备及计算机可读存储介质。本发明实施例通过根据待压缩的浮点数模型矩阵,获取所述浮点数模型矩阵的最小值和所述浮点数模型矩阵的最大值,进而根据所述数位宽度、所述浮点数模型矩阵的最小值和所述浮点数模型矩阵的最大值,对所述浮点数模型矩阵进行压缩处理,以获得定点数模型矩阵,通过采用定点化方法,对深度学习模型的浮点数模型矩阵进行压缩处理,以获得定点数模型矩阵,从而降低了深度学习模型的存储空间和运算量,同时提出该装置在深度学习网络中的实现框架以最大化深度学习网络精度,即矩阵乘法部分用该装置,其它部分例如激活函数等操作保留浮点操作。

    人工智能的异构硬件的任务调度方法、装置及可读介质

    公开(公告)号:CN107977268B

    公开(公告)日:2021-07-20

    申请号:CN201710952735.8

    申请日:2017-10-13

    发明人: 王勇 欧阳剑 漆维

    IPC分类号: G06F9/50 G06F9/48

    摘要: 本发明提供一种人工智能的异构硬件的任务调度方法、装置及可读介质。其方法包括:接收API发送的对应功能的任务执行请求,该任务执行请求中携带任务的属性信息;根据任务的属性信息获取任务的优先级,其中在线服务的优先级高于离线任务的优先级;根据任务的优先级,将对应的任务插入对应功能的调度队列中;调度队列中的各任务按照优先级由高到低排列;按照调度队列中各任务的优先级由高到低的顺序,依次控制对应功能的多个计算单元中的空闲计算单元执行对应的任务。本发明的技术方案,可以根据优先级的不同,实现离线的模型训练任务和在线推理服务的混步,从而能够大大提高资源利用率。

    信息处理方法和处理器

    公开(公告)号:CN110825439B

    公开(公告)日:2021-03-09

    申请号:CN201810907909.3

    申请日:2018-08-10

    发明人: 欧阳剑

    IPC分类号: G06F9/38 G06F9/30

    摘要: 本申请实施例公开了信息处理方法和处理器。所述处理器包括算术逻辑单元、旁路单元、队列单元、多路选择器和寄存器堆,所述旁路单元包括数据处理子单元;所述数据处理子单元,用于获取算术逻辑单元输出的至少一个有效的处理结果,从所述至少一个有效的处理结果中确定一个处理结果,向所述多路选择器输出所确定的处理结果,将所述至少一个有效的处理结果中,所确定的处理结果以外的处理结果向所述队列单元输出;所述多路选择器,用于向所述寄存器堆依次输出一个以上的有效的处理结果。本申请实施例可以通过旁路单元,减少处理结果在处理器中的缓存过程,提高处理器的处理效率。

    用于资源管理的方法、装置、电子设备和存储介质

    公开(公告)号:CN112395071A

    公开(公告)日:2021-02-23

    申请号:CN201910741694.7

    申请日:2019-08-12

    IPC分类号: G06F9/50

    摘要: 本公开的实施例提供了一种用于资源管理的方法、装置、电子设备和计算机可读存储介质。该方法包括:确定所要支持的多个虚拟功能,其中多个虚拟功能中的每个虚拟功能与计算设备上运行的虚拟机相对应。该方法还包括:将物理资源集合按预定比例划分成多个物理资源子集,物理资源子集的数目与虚拟功能的数目相同。该方法进一步包括:将多个物理资源子集分别分配给多个虚拟功能。本公开的实施例可以按空分复用的方式实现对物理资源的虚拟化,具有较小的硬件和软件开销,同时提高系统安全性和可靠性。

    并行提取多个卷积窗中的图像数据的方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN112306555A

    公开(公告)日:2021-02-02

    申请号:CN201910694475.8

    申请日:2019-07-30

    发明人: 梁子豪 欧阳剑

    IPC分类号: G06F9/30 G06F9/38 G06N3/04

    摘要: 本公开提供了一种并行提取多个卷积窗中的图像数据的方法、装置、设备以及计算机可读存储介质。方法包括将图像划分成多组卷积窗,其中多组卷积窗包括第一组卷积窗和第二组卷积窗,每组卷积窗包括多个卷积窗。方法还包括使用多个数据处理单元并行地提取第一组卷积窗中的多个卷积窗中的图像数据,并且在完成提取第一组卷积窗中的图像数据之后,使用多个数据处理单元并行地提取第二组卷积窗中的多个卷积窗中的图像数据。根据本公开的实施例,在卷积数据提取的过程中,使用多个数据处理单元并行地提取多个卷积窗中的图像数据,加快了数据提取的速度,由此提高了图像卷积的处理效率。

    用于处理循环指令集合的方法、装置、设备和介质

    公开(公告)号:CN112148367A

    公开(公告)日:2020-12-29

    申请号:CN201910559268.1

    申请日:2019-06-26

    IPC分类号: G06F9/30

    摘要: 根据本公开的实施例,提供了用于处理循环指令集合的方法、装置、设备和介质,涉及计算机领域。该方法包括响应于获取到循环指令集合的第一开始指令,将与循环指令集合相关的第一循环次数存储到第一寄存器;将与循环指令集合中的第一开始指令后的下一循环指令相对应的第一程序计数器值存储到第二寄存器中。该方法还包括获取循环指令集合中的第一开始指令后的循环指令以用于执行循环指令。该方法还包括响应于获取到指示循环指令集合结束的第一结束指令,基于第一寄存器中的第一循环次数和第二寄存器中的程序计数器值来确定循环指令集合的循环执行。上述方法消灭了循环首次进入和末次退出的条件判断造成的流水线等待或分支预测失败造成的流水线冲刷。