一种神经网络加速处理方法及相关装置

    公开(公告)号:CN114219080B

    公开(公告)日:2025-02-11

    申请号:CN202111682484.9

    申请日:2021-12-31

    Abstract: 本申请公开了一种神经网络加速处理方法,包括:加速设备从片上特征缓存模块获取特征数据;从片上权重缓存模块获取权重数据;采用逐点处理阵列中的多个处理组合以流水线的方式对特征数据和权重数据进行并行卷积计算,得到逐点卷积结果;采用累加模块对逐点卷积结果进行累加计算处理,得到逐点累加处理结果;采用逐通道处理阵列以流水线的方式对逐点累加处理结果和片上权重缓存模块中对应的权重数据进行并行卷积计算,得到逐通道卷积结果,提高对卷积计算进行加速的效果,并且兼容处理深度可分离卷积和普通卷积。本申请还公开了一种神经网络加速处理装置、加速系统以及计算机可读存储介质,具有以上有益效果。

    异构计算平台的数据处理方法、装置及可读存储介质

    公开(公告)号:CN111143272A

    公开(公告)日:2020-05-12

    申请号:CN201911385140.4

    申请日:2019-12-28

    Abstract: 本申请公开了一种异构计算平台的数据处理方法、装置及计算机可读存储介质。其中,方法包括预先在主机内存空间中开辟数据存储区域和数据处理结果存储区域,在FPGA加速板卡内存空间中开辟待处理数据存储区域和计算结果存储区域。主机将待计算数据存储在数据存储区域后,向FPGA加速板卡下发数据处理请求,FPGA加速板卡主动从数据存储区域读取待计算数据并存储至自己的待处理数据存储区域;然后调用相应数据处理算法对待处理数据存储区域中的待计算数据进行数据计算,得到数据计算结果并存储于自己的计算结果存储区域;最后主动将数据计算结果写回至主机的数据处理结果存储区域。本申请提高了异构计算平台的数据传递效率,提升FPGA加速板卡的计算性能。

    一种模型量化处理系统及一种模型量化处理方法

    公开(公告)号:CN114298291A

    公开(公告)日:2022-04-08

    申请号:CN202111591806.9

    申请日:2021-12-23

    Abstract: 本申请公开了一种模型量化处理系统,所述系统包括:BIAS参数存储器,用于存储神经网络模型的BIAS参数,并将BIAS参数传输至卷积计算模块;移位参数存储器,用于存储神经网络模型的移位参数,并将移位参数传输至卷积计算模块;零点参数存储器,用于存储神经网络模型的零点参数,并将零点参数传输至卷积计算模块;其中,BIAS参数存储器、移位参数存储器和零点参数存储器为BRAM类型的存储器;卷积计算模块,用于对量化参数进行量化计算并进行模型量化处理。本申请能够适应不同种类量化方法对应的量化参数的存储与更新,提高模型量化操作的效率。本申请还公开了一种模型量化处理方法,具有以上有益效果。

    一种多业务请求进程调用FPGA设备的方法及相关装置

    公开(公告)号:CN110955535B

    公开(公告)日:2022-03-22

    申请号:CN201911082281.9

    申请日:2019-11-07

    Abstract: 本申请公开了一种多业务请求进程调用FPGA设备的方法及相关装置,包括接收上层应用下发的待处理数据后发送FPGA状态查询消息至消息队列,接收并分析FPGA守护进程针对FPGA状态查询消息的应答消息,且当FPGA设备可用时发送共享内存编号申请请求至消息队列;在接收到共享内存编号后将待处理数据发送到共享内存编号对应的共享内存块中并发送业务请求类型消息至消息队列,以使FPGA设备基于业务请求类型消息处理待处理数据;从共享内存块中读取处理后的数据并将处理后的数据写入上层应用以及释放共享内存块。该方法可有效解决由于多进程调用FPGA设备导致的进程间同步互斥以及难以实现多进程公平使用FPGA设备的问题。

    一种神经网络加速处理方法及相关装置

    公开(公告)号:CN114219080A

    公开(公告)日:2022-03-22

    申请号:CN202111682484.9

    申请日:2021-12-31

    Abstract: 本申请公开了一种神经网络加速处理方法,包括:加速设备从片上特征缓存模块获取特征数据;从片上权重缓存模块获取权重数据;采用逐点处理阵列中的多个处理组合以流水线的方式对特征数据和权重数据进行并行卷积计算,得到逐点卷积结果;采用累加模块对逐点卷积结果进行累加计算处理,得到逐点累加处理结果;采用逐通道处理阵列以流水线的方式对逐点累加处理结果和片上权重缓存模块中对应的权重数据进行并行卷积计算,得到逐通道卷积结果,提高对卷积计算进行加速的效果,并且兼容处理深度可分离卷积和普通卷积。本申请还公开了一种神经网络加速处理装置、加速系统以及计算机可读存储介质,具有以上有益效果。

    一种并行加速LZ77解码方法及装置
    7.
    发明公开

    公开(公告)号:CN113890540A

    公开(公告)日:2022-01-04

    申请号:CN202111123970.7

    申请日:2021-09-24

    Abstract: 本申请公开了一种并行加速LZ77解码方法及装置,包括:控制LZ77解码器读取多个待解码数据单元,并将多个所述待解码数据单元分别进行组合以得到不同的组合数据对;所述待解码数据单元的类型为通过LZ77算法压缩得到的原字符或距离长度对,所述组合数据对为所述原字符、所述距离长度对之间的组合;根据所述组合数据对中所述待解码数据单元的类型控制所述LZ77解码器解码输出相应的目标数据,并通过数据拷贝模块对所述目标数据进行处理后写入片上RAM缓存,以得到解码后数据。本申请同时读取多个待解码数据单元,解决串行拷贝延迟过大的问题,同时增设片上RAM缓存,极大降低对片外内存的访问频率,有效降低访存延迟及访存带宽压力,提高解压缩性能。

    一种多业务请求进程调用FPGA设备的方法及相关装置

    公开(公告)号:CN110955535A

    公开(公告)日:2020-04-03

    申请号:CN201911082281.9

    申请日:2019-11-07

    Abstract: 本申请公开了一种多业务请求进程调用FPGA设备的方法及相关装置,包括接收上层应用下发的待处理数据后发送FPGA状态查询消息至消息队列,接收并分析FPGA守护进程针对FPGA状态查询消息的应答消息,且当FPGA设备可用时发送共享内存编号申请请求至消息队列;在接收到共享内存编号后将待处理数据发送到共享内存编号对应的共享内存块中并发送业务请求类型消息至消息队列,以使FPGA设备基于业务请求类型消息处理待处理数据;从共享内存块中读取处理后的数据并将处理后的数据写入上层应用以及释放共享内存块。该方法可有效解决由于多进程调用FPGA设备导致的进程间同步互斥以及难以实现多进程公平使用FPGA设备的问题。

Patent Agency Ranking