一种基于多GPU的BPNN训练方法和装置

    公开(公告)号:CN103996069A

    公开(公告)日:2014-08-20

    申请号:CN201310054733.9

    申请日:2013-02-20

    Inventor: 欧阳剑 王勇

    Abstract: 本发明提供了一种基于多图形处理器(GPU)的反向传播神经网络(BPNN)训练方法和装置,其中方法包括:S1、控制各GPU进行BPNN的正向计算,并在各GPU间同步正向计算输出;S2、控制各GPU进行BPNN的反向误差计算,并在各GPU间同步反向误差计算输出;S3、控制各GPU根据所述同步得到的正向计算输出与所述同步得到的反向误差计算输出更新BPNN的权重。本发明能够减少多GPU的BPNN训练时的数据同步开销,提高多GPU的BPNN训练效率。

    一种反向传播神经网络DNN的训练系统

    公开(公告)号:CN103150596A

    公开(公告)日:2013-06-12

    申请号:CN201310057598.3

    申请日:2013-02-22

    Inventor: 欧阳剑

    Abstract: 本发明提供了一种反向传播神经网络DNN的训练系统,包括:第一图形处理器组,用于进行DNN前向计算和权重更新计算;第二图形处理器组,用于进行DNN前向计算和DNN反向计算;控制器组,用于控制第一图形处理器组和第二图形处理器组分别根据各自的输入数据进行第N层DNN前向计算,直至前向计算完成之后,控制第一图形处理器组进行权重更新计算,并控制第二图形处理器组进行DNN反向计算,其中,N为正整数。本发明的训练系统具有训练速度快,数据传输开销低的优点,从而提升了反向传播神经网络DNN的训练速度。

    一种CPU与协处理器间的数据传输方法和装置

    公开(公告)号:CN103049421A

    公开(公告)日:2013-04-17

    申请号:CN201210532292.4

    申请日:2012-12-11

    Inventor: 欧阳剑 王勇

    Abstract: 本发明提供了一种CPU与协处理器间的数据传输方法和装置,其中方法包括:根据CPU生成的N个线程并行对N个协处理器的数据传输进行控制,所述N为大于或等于2的整数;所述控制包括:协处理器接收CPU以切片形式发送的数据;或者,协处理器接收并存储CPU或上一协处理器发送来的当前时刻的数据切片的同时,发送已存储的上一时刻的数据切片至下一协处理器。本发明能够充分利用各个协处理器与CPU之间的总线,以及各个协处理器之间的总线,能够提高CPU将数据传送至多个协处理器时以及协处理器将数据传输至其余多个协处理器时的数据传输效率。

    并行解压缩的硬件实现的系统及方法

    公开(公告)号:CN102244518B

    公开(公告)日:2016-01-20

    申请号:CN201010167216.9

    申请日:2010-05-10

    Abstract: 本发明公开了一种并行解压缩的硬件实现的系统及方法,该系统包含:不定长的位操作模块,用于对待解压缩数据进行不定长的位操作,获取不定长的数据;哈夫曼码表恢复模块,用于根据不定长的数据,恢复哈夫曼码表;哈夫曼译码模块,用于根据哈夫曼码表,并行执行哈夫曼译码;以及解码模块,用于根据哈夫曼译码的结果,进行解码。本发明提供了一种并行解压缩的硬件实现的系统及方法,使用可编程逻辑器件(FPGA)去实现Gzip解压缩功能,通过采用一种并行的解压算法,并且设计适合该算法的硬件电路结构,从而大幅度提高解压缩的处理效率。

    用于控制FPGA卡组的方法和装置

    公开(公告)号:CN109032853B

    公开(公告)日:2022-09-02

    申请号:CN201710433096.4

    申请日:2017-06-09

    Inventor: 张钊 欧阳剑

    Abstract: 本申请公开了用于控制FPGA卡组的方法和装置。该方法的一具体实施方式包括:获取FPGA卡组中的每一个FPGA卡的状态信息;根据状态信息,确定各个FPGA卡是否出现异常;响应于确定出FPGA卡出现异常,则停止出现异常的FPGA卡的工作并启用FPGA卡组中的其他FPGA卡代替异常的FPGA卡的工作。该实施方式提高了FPGA卡组计算系统的使用灵活性。

    一种反向传播神经网络DNN的训练系统

    公开(公告)号:CN103150596B

    公开(公告)日:2015-12-23

    申请号:CN201310057598.3

    申请日:2013-02-22

    Inventor: 欧阳剑

    Abstract: 本发明提供了一种反向传播神经网络DNN的训练系统,包括:第一图形处理器组,用于进行DNN前向计算和权重更新计算;第二图形处理器组,用于进行DNN前向计算和DNN反向计算;控制器组,用于控制第一图形处理器组和第二图形处理器组分别根据各自的输入数据进行第N层DNN前向计算,直至前向计算完成之后,控制第一图形处理器组进行权重更新计算,并控制第二图形处理器组进行DNN反向计算,其中,N为正整数。本发明的训练系统具有训练速度快,数据传输开销低的优点,从而提升了反向传播神经网络DNN的训练速度。

    数据解压装置及方法
    7.
    发明公开

    公开(公告)号:CN102236543A

    公开(公告)日:2011-11-09

    申请号:CN201010165576.5

    申请日:2010-05-07

    Abstract: 本发明涉及一种数据解压装置,包括驱动模块、硬件调度模块和片内多解压核,驱动模块用于将从多个应用程序进程接收到的并发的多个解压请求合并为一个解压命令,并将解压命令发送到硬件调度模块,以及将解压结果返给应用程序进程;硬件调度模块用于分析接收到的解压命令,为解压命令中的多个解压请求分别分配单独的解压核进行处理,以及在多个解压请求均处理完毕后,发送中断及状态信息到驱动程序;片内多解压核,包括多个单独的解压核,用于执行解压处理。本发明还涉及一种数据解压方法。本发明通过片内多解压核对多个数据解压缩线程的多个解压请求进行并行处理,既不需要耗费CPU资源,也可以增加解压缩的带宽,提高了解压缩的速度。

    一种CPU与协处理器间的数据传输方法和装置

    公开(公告)号:CN103049421B

    公开(公告)日:2019-08-27

    申请号:CN201210532292.4

    申请日:2012-12-11

    Inventor: 欧阳剑 王勇

    Abstract: 本发明提供了一种CPU与协处理器间的数据传输方法和装置,其中方法包括:根据CPU生成的N个线程并行对N个协处理器的数据传输进行控制,所述N为大于或等于2的整数;所述控制包括:协处理器接收CPU以切片形式发送的数据;或者,协处理器接收并存储CPU或上一协处理器发送来的当前时刻的数据切片的同时,发送已存储的上一时刻的数据切片至下一协处理器。本发明能够充分利用各个协处理器与CPU之间的总线,以及各个协处理器之间的总线,能够提高CPU将数据传送至多个协处理器时以及协处理器将数据传输至其余多个协处理器时的数据传输效率。

    使用目标网站的网站证书私钥进行解密的方法与设备

    公开(公告)号:CN107809412A

    公开(公告)日:2018-03-16

    申请号:CN201610816021.X

    申请日:2016-09-09

    Inventor: 韦韬 欧阳剑 章淼

    CPC classification number: H04L63/0442 H04L9/302 H04L9/3268 H04L63/0823

    Abstract: 本发明的目的是提供一种使用目标网站的网站证书私钥进行解密的方法与设备。具体地,解密网络设备向对应CA分发管理网络设备发送关于加密后的网站证书私钥的查询请求;接收CA分发管理网络设备响应于查询请求发送的加密后的所述网站证书私钥;基于对应硬件RSA解密卡生成的私钥对加密后的网站证书私钥进行解密处理,以获得该网站证书私钥的明文。与现有技术相比,本发明实现了以下有益效果:在网站证书私钥的下发过程中,对网站证书私钥进行了加密,且使用了非对称加密,进一步保证了加密密钥的安全性;硬件RSA解密卡及其所在的解密网络设备均不持久存储网站证书私钥的明文或密文,更进一步降低了网站证书私钥被窃取的风险。

    并行解压缩的硬件实现的系统及方法

    公开(公告)号:CN102244518A

    公开(公告)日:2011-11-16

    申请号:CN201010167216.9

    申请日:2010-05-10

    Abstract: 本发明公开了一种并行解压缩的硬件实现的系统及方法,该系统包含:不定长的位操作模块,用于对待解压缩数据进行不定长的位操作,获取不定长的数据;哈夫曼码表恢复模块,用于根据不定长的数据,恢复哈夫曼码表;哈夫曼译码模块,用于根据哈夫曼码表,并行执行哈夫曼译码;以及解码模块,用于根据哈夫曼译码的结果,进行解码。本发明提供了一种并行解压缩的硬件实现的系统及方法,使用可编程逻辑器件(FPGA)去实现Gzip解压缩功能,通过采用一种并行的解压算法,并且设计适合该算法的硬件电路结构,从而大幅度提高解压缩的处理效率。

Patent Agency Ranking