一种数据处理方法、装置、设备及可读存储介质

    公开(公告)号:CN111723913A

    公开(公告)日:2020-09-29

    申请号:CN202010567702.3

    申请日:2020-06-19

    Abstract: 本发明公开了一种数据处理方法、装置、设备及可读存储介质,该方法包括:获取待处理的媒体对象,并将媒体对象输入至LSTM网络;获取LSTM网络处理媒体对象过程中,所产生的需利用门结构处理的目标数据;利用FPGA的并行度参数,对目标数据进行重新排列,得到并行数据;利用FPGA中的矩阵向量乘法单元组,对并行数据进行矩阵向量乘处理,得到处理结果;将处理结果反馈给LSTM网络继续处理,得到媒体对象的输出结果。该方法能够利用FPGA对LSTM网络加速,使得LSTM网络能够被应用在嵌入式设备中对媒体对象进行处理,增强嵌入式设备的服务功能。

    数据缓存的方法和装置
    23.
    发明公开

    公开(公告)号:CN110673786A

    公开(公告)日:2020-01-10

    申请号:CN201910827022.8

    申请日:2019-09-03

    Abstract: 本发明提供一种数据缓存方法和装置,逐个获取输出矩阵,按照获取各个输出矩阵的先后顺序,将获取的多个输出矩阵交替的写入第一缓存单元的两个队列集合中,并且逐个将第一缓存单元中分行存储的输出矩阵写入第二缓存单元,按写入第二缓存单元的顺序,根据预设的参数逐个确定第二缓存单元的每个输出矩阵的有效数据,并将每个输出矩阵的有效数据写入第三缓存单元,第三缓存单元保存的输出矩阵的有效数据用于根据写入第三缓存单元的先后顺序依次写入到内存中。本方案利用写入速度与处理器计算速度匹配的缓存单元缓存输出矩阵,并将输出矩阵按生成时间的先后逐个完整的写入内存中。因此本发明能够解决处理器的计算速度与内存写入速度不匹配的问题。

    一种卷积网络加速方法、装置及系统

    公开(公告)号:CN110516790A

    公开(公告)日:2019-11-29

    申请号:CN201910760810.X

    申请日:2019-08-16

    Abstract: 本发明公开了一种卷积网络加速方法、装置及系统,包括获取预先存储的固定长度指令集,固定长度指令集为预先基于待处理卷积网络的结构和参数信息建立的;固定长度指令集中包括多个固定长度赋值指令和固定长度操作指令,每个固定长度赋值指令和每个固定长度操作指令分别对应至少一个寄存器;依据与固定长度赋值指令对应的寄存器值对相应的固定长度操作指令的寄存器进行赋值,以便依据寄存器的寄存器值确定相应的指令参数;固定长度赋值指令对应的寄存器值为依据卷积网络的参数信息确定的;依据与固定长度操作指令对应的寄存器值获取相应的指令参数,并根据指令参数执行相应的操作;本发明节约内存、使用灵活性强、编译和映射的效率高、难度低。

    并行计算结果的过滤方法及系统

    公开(公告)号:CN110516332A

    公开(公告)日:2019-11-29

    申请号:CN201910755046.7

    申请日:2019-08-15

    Abstract: 本发明公开了一种并行计算结果的过滤方法及系统,通过同时生成每个分片的第一有效位置fvp的输入值,并同时以每一个分片各自对应的第一有效位置fvp输入值计算得到每个第一有效位置fvp的输入值对应的输出结果,并根据第一个分片的第一有效位置fvp输出结果,依次选择第二到S个分片的输出结果的方式、对并行计算结果进行过滤,最终得到正确的并行计算结果。本发明的采用并行过滤的方式,让本来串行的过滤计算改为S个分片的并行计算,计算时间只有原来的S分之一,提高计算效率的同时能够满足并行计算的时序需求。

Patent Agency Ranking